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(57) Abstract: The invention relates to a method for producing carotenoids or their precursors using genetically modified organ- 
isms of the Blakeslea genus. Said method comprises the following steps (i) transformation of at least one of the cells, (ii) optional 
homokaryotic conversion of the cells obtained in step (i) to produce cells, in which one or more genetic characteristics of the nucleii 
are all modified in an identical manner and said modification manifests itself in the cells, (iii) selection and reproduction of the 
genetically modified cell or cells, (iv) cultivation of the genetically modified cells, (v) preparation of the carotenoids produced by 
the genetically modified cells or the carotenoid precursor produced by said genetically modified cells. The invention also relates to 
carotenoids or their precursors produced according to said method and to the use thereof. 
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(57) Zusammenfassung: Verfahren zur Herstellung von Carotinoiden oder deren Vorstufen mittels gentechnisch veranderter Orga- 
nismen der Gattung Blakeslea umfassend (i) (i) Transformation mindestens einer der Zellen, (ii) ggf. Homokaryotisierung der aus 
(i) erhaltenen Zellen, so dass Zellen entstehen, in denen die Keme in einem oder in mehreren genetischen Merkmalen alle gleichar- 
tig verandert sind und diese genetische Veranderung zur Auspragung bringen, und (ix) Selektion und Vermehrung der gentechnisch 
veranderten Zelle oder Zellen, (x) Kultivierung der gentechnisch veranderten Zellen, (xi) Bereitstellung des von den gentechnisch 
veranderten Zellen produzierten Carotinoids oder der von den gentechnischen veranderten Zellen produzierten Carotinoidvorstufe; 
nach dem Verfahren hergestellte Carotinoide oder deren Vorstufen und deren Verwendung. 
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Verfahren zur Herstellunq von Carotinoiden Oder deren Vorstufen 
mittels qentechnisch veranderter Oraanismen der Gattyng Blakes- 
lea. mit dem Verfahren hergestellte Carotinoide oder deren Vorstufen 

und deren Verwendunq 

Die Erflndung betrifft ein Verfahren zur Herstellung von Carotinoiden oder 
deren Vorstufen mittels gentechnisch veranderten Organismen der Gat- 
tung Blakeslea, mit dem Verfahren hergestellte Carotinoide oder deren 
Vorstufen und deren Verwendung und Bereitstellung, besonders als hoch- 

10 reine Carotinoide, als Nahrungsmittel, enthaltend Carotinoide- 
produzierende Organismen und mindestens ein Carotinoide insbesondere 
Tierfuttermittel, Tierfuttererganzungsmittel und Nahrungserganzungsmittel, 
sowie die Verwendung der aus dem Verfahren erhaltlichen Carotinoide zur 
Herstellung von kosmetischen, pharmazeutischen, dermatologischen Zu- 

15 bereitungen, Nahrungsmitteln oder Nahrungserganzungsmitteln. 

Blakeslea trispora ist als Produktionsorganismus fOr P-Carotin (Ciegler, 
1965, Adv Appl Microbiol. 7:1) und Lycopin bekannt (EP 1201762, EP 
1 1 84464, WO 03/038064). 

20 

Von Blakeslea trispora sind bisher verschiedene DNA-Sequenzen be- 
kannt, insbesondere die DNA-Sequenz, die fur die Gene der Carotinoid- 
biosynthese von Geranylgeranylpyrophosphat bis p-Carotin codiert (WO 
03/027293). 

25 

Insbesondere aufgrund der hohen Produktivitat, die mit Blakeslea in der 
Produktion von Lycopin und p-Carotin erreicht werden, bietet sich dieser 
Organismus zur fermentativen Herstellung von Carotinoiden an. 

30 Es ist auch von Interesse die Produktivitaten der bisher naturlicherweise 
produzierten Carotine und deren Vorstufen weiter zu steigem und die Her- 
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stellung weiterer Carotinoide, wie z. B. Xanthophylle zu ermoglichen, die 
von Blakeslea bisher nicht Oder nur in sehr geringem MalJe gebildet und 
isoliert werden konnen. 

5 Carotinoide werden Futtermitteln, Nahrungsmitteln, Nahrungsergan- 
zungsmitteln, Kosmetika und Arzneimitteln zugesetzt. Die Carotinoide die- 
nen vor allem als Pigmente zur Farbung. Daneben werden die antioxidati- 
ve Wirkung der Carotinoide und andere Eigenschaften dieser Substanzen 
genutzt. Man unterteilt die Carotinoide in die reinen Kohlenwasserstoffe, 

10 die Carotine und die sauerstoffhaltigen Kohlenwasserstoffe, die Xantho- 
phylle. Xanthophylle wie Canthaxanthin und Astaxanthin werden bei- 
spielsweise zur Pigmentierung von HQhnereiern und Fischen eingesetzt 
(Britton et ai. 1998, Carotinoids, Vol 3, Biosynthesis and Metabolism). Die 
Carotine B-Carotin und Lycopin werden vor allem in der Humanem§hrung 

15 eingesetzt. B-Carotin wird beispielsweise als Getrankefarbstoff verwendet. 
Lycopin hat eine krankheitsvorbeugende Wirkung (Argwal und Rao, 2000, 
CMAJ 163:739-744; Rao und Argwal 1999, Nutrition Research 19:305- 
323). Die farblose Carotinoidvorstufe Phytoen kommt vor allem fur An- 
wendungen als Antioxidans in kosmetischen, pharmazeutischen oder 

20 dermatologischen Zubereitungen in Frage. 

Der Qberwiegende Teil der Carotinoide und deren Vorstufen, die als Zu- 
satzstoffe fQr die oben genannten Anwendungen eingesetzt werden, wird 
durch chemische Synthese hergestellt. Die chemische Synthese ist tech- 

25 nisch sehr aufwendig und verursacht hohe Herstellkosten. Fenmentative 
Verfahren sind demgegenQber technisch verhaltnismaaig einfach und ba- 
sieren auf kostengunstigen Einsatzstoffen. Fermentative Verfahren zur 
Herstellung von Carotinoiden und deren Vorstufen kSnnen dann 
wirtschaftlich attraktiv und wettbewerbsfahig zur chemischen Synthese 

30 sein, wenn die Produktivitat der bisherigen fermentativen Verfahren 
gesteigert wOrde oder neue Carotinoide auf Basis der bekannten 
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wurde Oder neue Carotinoide auf Basis der bekannten Produktionsorga- 
nismen hergestellt werden kSnnten. 

Hierzu ist eine gentechnische, d. h. gezielte genetische Veranderung von 
5 Blakeslea erforderlich. Insbesondere, wenn Xanthophylle produziert wer- 
den sollen, da diese Verbindungen naturiicherweise vom Wildtyp der Bla- 
keslea nicht synthetisiert werden. 

Z. B. zur Herstellung von Phytoen mittels Fermentation von Blakesles 
10 trispora sind bisher zwei Methoden bekannt: 

(i) Durch zufallsabhangige Mutagenese mit chemischen Agenzien 
wie MNNG kbnnen Mutanten erzeugt werden, in denen Phytoen 
nicht zu Lycopin und somit nicht weiter zu ft-Carotin umgesetzt 
werden kann (Mehta und Cerda-Olmedo, 1995, Appl. Microbiol. 

15 Biotechnol. 42:836-838). 

(ii) Durch Zugabe von Inhibitoren des Enzyms Phytoendesaturase 
wie z.B. Diphenylamin und Zimtalkohol kann die weitere Umsetzung 
von Phytoen blockiert werden, so dass es sich anreichert (Cerda- 

20 Olmedo, 1989, In: E. Vandamme, ed. Biotechnology of vitamin, 

growth factorand pigment production. London: Eisevier Applied Sci- 
ence, S. 27-42). 

Die genannten Methoden zur Herstellung von Phytoen mit Blakeslea 
25 trispora weisen jedoch eine Reihe von Nachteilen auf. 

Die zufallsabhangie Mutagenese betrifft in der Regel nicht nur die Gene 
der Carotinoidbiosynthese zur weiteren Umsetzung von Phytoen, sondem 
auch weitere wichtige Gene. Daher sind Wachstum und Syntheseleistung 
30 der Mutanten oft beeintrachtigt. Die Erzeugung z. B. von Phytoenuberpro- 
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duzenten durch zufallsabhangige Mutagenese von LycopinQberproduzen- 
ten oder B-Carotinuberproduzenten ist daher entweder nicht oder nur mit 
grodem experimentellem Aufwand zu erreichen. Die Zugabe von Inhibito- 
ren verursacht eine Erhohung der Produktionskosten und gegebenenfalls 
5 eine Verunreinigung des Produktes. Daneben kann das Zellwachstum 
durch den Inhibitor beeintrachtigt werden, so dass die Produktion von Ca- 
rotinoiden oder deren Vorstufen, insbesondere Phytqen eingeschrankt 
wird. 

10 Durch eine gentechnische Veranderung konnten die oben genannten 
Nachteile der zufallsabhangigen Mutagenese und der Inhibitorzugabe 
vermieden werden. 

15 Allerdings sind bisher keine Methoden zur gentechnischen, d. h. gezielten 
gentechnischen Veranderung von Blakeslea, insbesondere Blakeslea 
trispora bekannt. 

Als Methode zur Herstellung von gentechnisch veranderten Pilzen wurde 
20 in einigen Fallen die Agrobacterium-vermittelte Transformation erfolgreich 
eingesetzt. So sind z. B. foigende Organismen durch Agrobakterien trans- 
formiert worden: Saccharomyces cerevisiae (Bundock et al., 1995, EMBO 
Journal, 14:3206-3214), Aspergillus awamori, Aspergillus nidulans, 
Aspergillus niger, Colletotrichum gloeosporioides, Fusarium solani pisi, 
25 Neurospora crassa, Trichoderma reesei, Pleurotus ostreatus, Fusarium 
graminearum (van der Toorren et al., 1997, EP 870835), Agraricus bispo- 
rus, Fusarium venenatum (de Groot et al., 1998, Nature Biotechnol. 
16:839-842), Mycosphaerella graminicola (Zwiers et al. 2001, Curr. Ge- 
net. 39:388-393), Glarea lozoyensis (Zhang et al., 2003, Mol. Gen. Ge- 
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nomics 268:645-655), Mucor miehei (Monfort et al. 2003, FEMS Microbio- 
logy Lett. 244:101 - 106). 

Von interesse ist besonders eine homologe Rekombination, bei der zwi- 
5 schen der einzufuhrenden DNA und der Zell-DNA moglichst viele Se- 
quenzhomologien bestehen, so dass eine ortsspezifische Einfuhrung bzw. 
Ausschaltung von genetischer Information im Genom des Empfangeror- 
ganismus mdglich ist. Andemfalls wird die Spender-DNA durch illegitime 
bzw. nicht-homologe Rekombination ins Genom des Empfangerorganis- 
10 mus integriert, was nicht ortsspezifisch erfolgt. 

Eine durch Agrobacterium vermittelte Transformation und anschlieliende 
homologe Rekombination der transferierten DNA wurde bisher bei folgen- 
den Organismen nachgewiesen: Aspergillus awamori (Gouka et al. 1999, 
15 Nature Biotech 17:598-601), Glarea lozoyensis (Zhang et al., 2003, Mol. 
Gen. Genomics 268:645-655), Mycosphaerella graminicola ((Zwiers et al. 
2001, Curr. Genet. 39:388-393). 

Als weitere Methode zur Transformation von Pilzen ist die Elektroporation 
20 bekannt. Die integrative Transformation von Hefe durch Elektroporation 
wurde von Hill, Nucl. Acids. Res. 17:8011 gezeigt. FOr filamentose Pilze 
wurde die Transformation durch Chakaborty und Kapoor beschrieben 
(1990, Nucl. Acids. Res. 18:6737)! 

25 Eine „biolistische u Methode, d.h. die Obertragung von DNA durch Be- 
schuss von Zellen mit DNA-beladenen Partikeln wurde beispielsweise fur 
Trichoderma harzianum und Gliocladium virens beschrieben (Lorito et al. 
1993, Curr. Genet. 24:349-356). 
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Diese Methoden konnten bisher jedoch nicht erfolgreich zur gezielten ge- 
netischen Veranderung von Blakeslea und insbesondere Blakeslea trispo- 
ra. eingesetzt werden. 

5 Eine besondere Schwierigkeit bei der Herstellung von gentechnisch ver- 
anderten Blakeslea und Blakeslea trispora, ist die Tatsache, dass deren 
Zellen in alien Stadien des sexuellen und des vegetativen Zellzyklus 
mehrkernig sind. In Sporen von Blakeslea trispora Stamm NRRL2456 und 
NRRL2457 wurden z. B. im Durchschnitt 4,5 Kerne pro Spore nachgewie- 

10 sen (Metha und Cerda-Olmedo, 1995, Appl. Microbiol. Biotechnol. 42:836- 
838). Dies hat zur Folge, dass die gentechnische Veranderung in aller 
Regel nur in einem oder wenigen Kernen vorliegt, die Zellen also hetero- 
karyotisch sind. 

15 Sollen die genetisch veranderten Blakeslea, insbesondere Blakeslea 
trispora zur Produktion eingesetzt werden, so ist es insbesondere bei einer 
Gendeletion wichtig, dass in den Produktionsstammen die gentechnische 
Veranderung in alien Kernen vorliegt, so dass eine stabile und hohe Syn- 
theseleistung ohne Nebenprodukte mdgiich wird. Die Stamme mOssen 

20 folglich in Bezug auf die gentechnische Veranderung homokaryotisch sein. 

Lediglich fur Phycomyces blakesleeanus ist ein Verfahren beschrieben 
worden, um homokaryotische Zellen zu erzeugen (Roncero et al., 1984, 
Mutat. Res. 125:195). Durch Zugabe des mutagenen Agens MNNG (N- 

25 Methyl-N'-nitro-N-nitrosoguanidin) werden nach dem dort beschriebenen 
Verfahren Kerne in den Zellen eliminiert, so dass statistisch eine gewisse 
Anzahl von Zellen mit nur noch einem funktionellem Kem vorliegt. Die Zel- 
len werden dann einer Selektion unterzogen, in der nur einkernige Zellen 
mit einem rezessiven Selektionsmarker zu einem Mycel auswachsen k6n- 

30 nen. Die Nachkommen dieser selektierten Zellen sind mehrkernig und 
homokaryotisch. Ein rezessiver Selektionsmarker far Phycomyces blakes- 
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leanus ist z. B. dar. dar + -Stamme nehmen das toxische Riboflavin-Analog 
5-Carbon-5-deazaiiboflavin auf; dar'-Stamme dagegen nicht (Delbrtick et 
al. 1979, Genetics 92:27). Die Selektion von rezessiven Mutanten erfolgt 
durch Zugabe von 5-Carbon-5-deazariboflavin (DARF). 

5 

Allerdings ist dieses Verfahren nicht fQr Blakeslea, insbesondere Blakes- 
lea trispora bekannt und insbesondere nicht mit im Zusammenhang mit 
einer Transformation oder der Produktion von Carotinoiden oder deren 
Vorstufen beschrieben worden. 

10 

Auch die Isolierung aus natQrlichen Quellen wird durchgefuhrt. Beispiels- 
weise ist es fQr die Gewinnung von Phytoen bekannt, ein Gemisch aus 
Carotinoiden, Vitamin E und anderen Komponenten, welches auch Phy- 
toen enthalt, aus Tomaten, Karotten oder Palmdl usw. zu extrahieren. 
15 Problematisch ist hierbei die Trennung der einzelnen Carotinoide vonein- 
ander. So ist beispielsweise das Phytoen nach diesem Verfahren nicht in 
reiner Form erhaltlich. Insbesondere ist die naturiich vorkommende Menge 
der Carotinoiden in den Pflanzen gering. 

20 Fermentative Verfahren sind demgegeniiber technisch verhaltnismaliig 
einfach und basieren auf kostengunstigen Einsatzstoffen. Fermentative 
Verfahren zur Herstellung von Carotinoiden konnen dann wirtschaftlich 
attraktiv und wettbewerbsfahig zur chemischen Synthese sein, wenn die 
Produktivitat der bisherigen fermentativen Verfahren gesteigert wQrde oder 

25 neue Carotinoide auf Basis der bekannten Produktionsorganismen herge- 
stellt werden konnten. Problematisch bei der fermentativen Herstellung 
von Carotinoiden sind allerdings die Aufarbeitungsverfahren, die nur ge- 
ringe Mengen an hochreinen Carotinoiden bereitstellen. Zudem sind dafur 
meist aufwendige Vielschritt-Prozesse ggf. unter Verwendung grofcer L6- 

30 sungsmittelmengen erforderlich. So fallen grolie Mengen Abfall an oder es 
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muss ein hoher Aufwand zur Wiederverwertung (Recycling) betrieben 
werden. 

Die Produktion von Carotinoiden durch verschiedene Mikroorganismen ist 
5 an sich bekannt. So ist z. B. in der WO 00/13654 A2 offenbart, ein Ge- 
misch aus Phytoen und Phytofluen aus Algen der Art Dunaliella sp. zu ex- 
trahieren. Auch nach diesem Verfahren ist das Phytoen nicht in reiner 
Form erhaltlich und muss von den anderen Produkten getrennt werden. 
Zudem handelt es sich urn gentechnisch unveranderte Aigen, deren Bio- 
10 synthese mittels eines hinzugefiigten Inhibitors beeinflusst werden muss. 

Blakeslea trispora als Produktionsorganismus fOr B-Carotin ist auch aus 
der WO 98/03480 A1. bekannt. Hier werden B-Carotin Kristalle aus Bio- 
masse von Blakeslea trispora mittels Extraktion erhalten. Allerdings mus- 
15 sen in dem beschriebenen Verfahren gro&e Mengen unterschiedlicher L6- 
sungsmittel eingesetzt werden, urn Kristalle mit hoher Reinheit durch meh- 
rere Extraktions- und Waschschritte zu erhalten. Auch sind die erhaltenen 
Mengen B-Carotin bezogen auf die eingesetzte Menge Biomasse klein. 

20 Aus der WO 01/83437 A1 ist ein Verfahren zur Extraktion von Astaxanthin 
aus Hefe bekannt, bei dem die KulturbrQhe zur Sterilisation und zum Zell- 
aufschluss mit Mikrowellenstrahlung behandelt wird. Der Zellaufschluss 
mittels Mikrowellenstrahlung ist danach notig, urn Astaxanthin aus Hefe zu 
gewinnen, ohne es dabei zu zerstOren. AnschlieBend soil Astaxanthin mit- 

25 tels Methanol, Ethanol oder Aceton oder deren Mischungen extrahiert 
werden. Hierzu sind allerdings grolie Mengen LSsungsmittel (5 bis 20 Tei- 
le L6sungsmittel auf 1 Teil Suspension) und ein langer Zeitraum (24h) er- 
forderlich. Zudem sind keine Reinheiten des Astaxanthins angegeben und 
die erhaltenen Mengen sind klein. Versuche der Anmelderin und andere 

30 Veroffentlichungen bestatigen jedoch, dass eine Extraktion mittels Metha- 
nol oder Ethanol nicht durchfuhrbar ist. 
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Aus der WO 98/50574 ist ebenfails die Isolierung von Carotinoid Kristallen 
aus Biomasse von Mikroorganismen bekannt, wobei hiernach im Gegen- 
satz zur WO 01/83437 A1 Methanol, Ethanol, Aceton nur zum Entfemen 

5 von Lipiden aus der Biomasse d. h. .zum Waschen verwendet werden 
kann. Als Losungsmittel zur Extraktion von Carotinoiden wird demnach 
Ethylacetat, Hexan odef ein Ol verwendet. Anschlieftend sind mehrere 
Reinigungs- und Waschschritte mit groften Mengen Ethanol und Wasser 
notig, wobei lediglich eine Reinheit von 93,3 % bei einer Ausbeute von 35 

10 % erreicht wird. 

Die WO 03/038064 A2 beschreibt die fermentative Produktion von Lycopin 
durch Co-Kultivierung von mutiertem Blakeslea trispora Paarungstyp (-) 
und Blakeslea trispora Paarungstyp (+), die ohne Zusatz von Inhibitoren 

15 der Carotinoid Biosynthese Lycopin herstellen. Die Erzeugung der zur 
Fermentation eingesetzten Mutante wird durch unselektive chemische Mu- 
tation und anschlie&endes Screening vorgenommen. Die Aufarbeitung der 
KulturbrQhe erfolgt mittels Zellaufschluss und anschliedender Reinigung 
mit unterschiedlichen wassrigen Medien mit verschiedenem Salzgehalt 

20 und pH-Wert und mit Wasser nicht mischbaren organischen Losungsmit- 
teln wie Ethylacetat, Hexan und 1- Butanol zur Entfernung von Lipiden. 
Altemativ ist eine Extraktion mittels grofter Mengen Ethylacetat beschrie- 
ben. Angaben zur Reinheit fehlen. Da Ethylacetat und Hexan LOsungsmit- 
tel fOr Lycopin sind, ist davon auszugehen, dass ein Teil des Lycopins 

25 herausgewaschen und so die theoretische mogliche Ausbeute verringert 
wird. 

Auch aus der WO 01/55100 A1 ist die Isolierung von Carotinoiden allge- 
mein bzw. B-Carotin im speziellen aus der Biomasse durch Anwendung 
30 mehrerer Wasch- und Reinigungsschritte auf die aufgeschlossene Bio- 
masse ohne Extraktion mittels LSsungsmittel beschrieben. Hierzu wird 
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aufgeschlossene Biomasse von Blakeslea trispora mit Wasser, Lauge, 
Saure, Butanol und Ethanol gewaschen, so daft eine grolie Zahl unter- 
schiedlicher Losungsmittel und wassriger Median verwendet werden 
muss. Die Reinheit des erhaltenen p-Carotins betragt 96 - 98 %. Angaben 
5 zur Ausbeute fehlen jedoch. 

Die WO 97/36996 A2 beschreibt allgemein eine Verfahren zur Isoliening 
von Substanzen (u. a. Carotinoide) aus Mikroorganismen, wobei die Sub- 
stanzen aus der Biomasse mittels Fest/Flttssig-Extraktion isoliert werden. 
10 Ein Zellaufschluft soil hierbei nicht nOtig sein, jedoch muss die Biomasse 
zunachst durch Extrusion in eine granulierte, porose Gestalt gebracht 
werden. Wie nur Carotinoide isoliert werden konnen und wie deren Rein- 
heit bzw. Ausbeute ist, ist nicht angegeben. Der Ruckstand der Extrusion 
kann anschlieliend als Futtermittelzusatz verwendet werden. 

15 

In alien oben beschriebenen Verfahren mOssen grofce Mengen Losungs- 
mittel zur Extraktion eingesetzt werden, urn die isolierte Menge an Caroti- 
noid durch vollstandige Extraktion zu erhohen, und/oder grolie Mengen 
wassriger Medien zur Reinigung und zum Waschen eingesetzt werden. 
20 Dies bedingt hohe Kosten und aufwendige Mafinahmen zur Wiederver- 
wendung bzw. ggf. Abfalle. 

Zudem werden die nahrhafte KulturbrOhe und die darin enthaltene Bio- 
masse nach Extraktion bzw. Isolierung der Carotinoide als Abfall behan- 
delt. Die oben angegebenen Verfahren haben neben diesen vordergrundi- 

25 gen Nachteilen einen entscheidenden weiteren Nachteil. Es ist namlich 
danach notwendig, die Carotinoide den Nahrungsmitteln nachtraglich zu- 
zusetzen, d. h. sie sind nicht Bestandteil der Nahrungsmittel an sich bzw. 
nicht in ausreichender Menge. Von groBem Vorteil ware daher, wenn der 
Gehalt an Carotinoiden in den Nahrungsmitteln bereits durch die eigentli- 

30 chen Nahrungsmittel selbst gedeckt wOrde. 
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Es ist ebenfalls nStig die Produktivitaten der bisher natQrlicherweise pro- 
duzierten Carotlne und deren Vorstufen weiterzu steigern und die Herstel- 
lung weiterer Carotinoide, wie z. B. Xanthophylle besonders bevorzugt 
Astaxanthin Oder Zeaxanthin und Phytoen Oder Bixin zu ermdglichen, die 
5 von den Wildtypen der Mikroorganismen bisher nicht oder nur in sehr ge- 
ringem MalJe gebildet und isoliert werden k6nnen. 

Aufgabe der Erfindung ist es gentechnisch verSnderte Zellen von Blakes- 
10 lea-Stammen, insbesondere Blakeslea trispora bereitzustellen, die Caroti- 
noide oder deren Vorstufen, insbesondere Xanthophylle, besonders be- 
vorzugt Astaxanthin oder Zeaxanthin und Phytoen oder Bixin produzieren. 
Zudem soil das Verfahren die Steigerung der Carotinoid-Produktivitat der 
veranderten Zellen gegentlber den korrespondierenden Wildtypen erlau- 
15 ben. Ferner soil das Verfahren die Erzeugung neuer Zellen oder aus ihnen 
bestehendes Mycel erlauben, die sich fOr die Verwendung zur Herstellung 
von Carotinoiden oder deren Vorstufen eignen, die bisher nicht in wirt- 
schaftlich interessanten Mengen aus den natOrlich vorkommenden Pilzen 
gewinnbar waren, insbesondere Xanthophylle, besonders bevorzugt Asta- 
20 xanthin oder Zeaxanthin und Phytoen oder Bixin. Das Verfahren soil dabei 
eine gentechnische Veranderung von Blakeslea-Stammen, insbesondere 
Blakeslea trispora moglich machen und die Herstellung homokaryotischer 
gentechnisch veranderter Produktions-Stamme erlauben. 

25 Des weiteren soil das Verfahren die Herstellung weiterer Carotinoide, wie 
z. B. Xanthophylle, insbesondere Astaxanthin oder Zeaxanthin und Phy- 
toen oder Bixin errnSglichen, die von den Wildtypen der Mikroorganismen 
bisher nicht oder nur in sehr geringem Made gebildet und isoliert werden 
konnen. 



30 
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Ferner ist es Aufgabe der vorliegenden Erfmdung ein Verfahren zur Her- 
stellung von Carotinoiden aus gentechnisch veranderte Zellen von Blakes- 
lea-Stammen, insbesondere Blakeslea trispora, zur VerfQgung zu stellen, 
welches den Einsatz geringerer LSsungsmittelmengen eriaubt und im we- 
5 sentlichen ohne Abfalle auskommt und zudem eine hohe Reinheit und h6- 
here Ausbeuten eriaubt. 

In diesem Zusammenhang soil ein moglichst groBer Anteil der im Fermen- 
ter vorliegenden NShrstoffe, sowohl Carotinoide als auch weitere sich in 
den Mikroorganismen befindende, verwertet werden. 

10 Somit ist es auch Aufgabe der vorliegenden Erfindung ein Verfahren zur 
Herstellung eines Carotinoid-haltigen Nahrungsmittels bereitzustellen, wo- 
bei das Nahrungsmittel selbst den Bedarf an Carotinoiden ohne Zusatze 
deckt. Insbesondere soil der Nahrstoffgehalt der nach dem Verfahren er- 
haltlichen Nahrungsmittel gegenQber den bisher erhaltlichen Nahrungsmit- 

15 teln zumindest gleichwertig sein. Femer soli das Verfahren die effiziente 
Venwertung der produzierten Carotinoide ermdglichen. 

Diese Aufgabe wird durch ein Verfahren zur Herstellung von Carotinoiden 
20 oder deren Vorstufen mittels gentechnisch ver^nderten Organismen der 
Gattung Blakeslea gelost, umfassend 

(i) Transformation mindestens einer der Zellen, 

(ii) ggf. Homokaryotisierung der aus (i) erhaltenen Zellen, so dass 
Zellen entstehen, in denen die Kerne in einem oder in mehreren 

25 genetischen Merkmalen alle gleichartig verandert sind und diese 

genetische Verandemng zur AusprSgung bringen, und 

(Hi) Selektion und Vermehrung der gentechnisch verSnderten Zelle 
oder Zellen, 

(iv) Kultivierung der gentechnisch veranderten Zellen, 
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(v) Bereitstellung des von den gentechnisch veranderten Zellen 
produzierten Carotinoids oder der von den gentechnischen ver- 
anderten Zellen produzierten Carotinoidvorstufe. 



5 Mlt der erfindungsgemafien Methode ist es moglich, Blakeslea gezielt und 
stabil genetisch zu verandern, um so Mycel aus Zellen mit elnheitlichen 
Kernen zu gewinnen, das Carotinoide oder deren Vorstufen, insbesondere 
Xanthophylle, besonders bevorzugt Astaxanthin oder Zeaxanthin und Phy- 
toen oder Bixin produziert. Vorzugsweise handelt es slch um Zellen von 

10 Pilzen der Art Blakeslea trispora. Die produzierten Carotinoiden oder de- 
ren Vorstufen sind dabei im wesentlichen frei von Verunreinigungen erhSIt- 
lich und es konnen hohe Konzentrationen der Carotinoiden oder deren 
Vorstufen im Kulturmedium erzielt werden. 

15 Unter Transformation wird die Obertragung einer genetischen Information 
in den Organismus, insbesondere Pilz verstanden. Darunter sollen alle 
dem Fachmann bekannten MQglichkeiten zur Einschleusung der Informa- 
tion, insbesondere DNA fallen, z. B. Beschuss mit DNA-beladenen Parti- 
keln, Transformation mittels Protoplasten, Mikroinjektion von DNA, Elek- 

20 troporation, Konjugation oder Transformation kompetenter Zellen, Chemi- 
kalien oder Agrobakterien vermittelte Transformation. Als genetische In- 
formation werden ein Genabschnitt, ein Gen oder mehrere Gene verstan- 
den. Die genetische Information kann z. B. mit Hilfe eines Vectors oder als 
freie Nukleinsaure (z. B. DNA, RNA) und auf sonstige Weise in die Zellen 

25 eingebracht und entweder durch Rekombination ins Wirtsgenom einge- 
baut oder in freier Form in der Zelie vorliegen. Besonders bevorzugt ist 
hierbei die homologe Rekombination. 

Bevorzugte Transformationsmethode ist die Agrobacterium tumefaciens- 
30 vermittelte Transformation. Hierzu wird zunachst die zu transferierende 
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Spender-DNA in einen Vektor eingefQgt, der (i) flankierend zu der zu 
transferierenden DNA die T-DNA-Enden tragt, der (ii) einen Selektions- 
marker enthalt und der (iii) ggf . Promotoren und Terminatoren filr die Ge- 
nexpression der Spender-DNA aufweist. Dieser Vektor wird in einen Agro- 

5 bacterium-tumefaciens-Stamm Qbertragen, der ein Ti-Plasmid mit den vir- 
Genen enthalt. vir-Gene sind fQr den DNA-Transfer in Blakeslea verant- 
wortlich. Mit diesem Zwei-Vektor-System wird die DNA von Agrobacterium 
in Blakeslea Qbertragen. Hierzu werden die Agrobakterien zunachst in 
Gegenwart von Acetosyringone inkubiert. Acetosyringone induziert die vir- 

10 Gene. AnschlieBend werden Sporen von Blakeslea trispora zusammen mit 
den induzierten Zellen von Agrobacterium tumefaciens auf Acetosyringo- 
ne-haltigem Medium inkubiert und dann auf Medium Qbertragen, das eine 
Selektion der Transformanten, d.h. der gentechnisch veranderten Stamme 
von Blakeslea ermoglicht. 

15 

Der Begriff Vector wird in der vorliegenden Anmeldung als eine Bezeich- 
nung fQr ein DNA-MolekQI verwendet, das zum Einschleusen und ggf. zur 
Vermehrung von Fremd-DNA in eine Zelle dient (siehe auch "Vector" in 
Rompp Lexikon Chemie - CDROM Version 2.0, Stuttgart/New York: Ge- 
20 org Thieme Verlag 1999). In der vorliegenden Anmeldung sollen unter 
dem begriff "Vector" auch Plasmide, Cosmide usw. verstanden werden, 
die dem gleichen Zweck dienen. 

Unter Expression wird in der vorliegenden Anmeldung die Ubertragung 
25 einer genetischen Information ausgehend von DNA oder RNA in ein Gen- 
Produkt (hier vorzugsweise Enzyme zur Herstellung von Carotinoiden und 
insbesondere Xanthophylle, besonders bevorzugt Astaxanthin oder Zea- 
xanthin und Phytoen oder Bixin) verstanden und soil auch den Begriff der 
Oberexpression beinhalten, womit eine verstarkte Expression gemeint ist, 
30 so dass ein bereits in der nicht tfansformierten Zelle (Wildtyp) hergestell- 
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tes Genprodukt verstarkt produziert wird oder einen groften Teil des ge- 
samten Gehaltes der Zelle ausmacht. 

Unter genfechnische Veranderung soil die Einschleusung genetischer In- 
5 formation in einen Empfangerorganismus, so dass diese stabil exprimiert 
und bei der Zellteilung weitergegeben wird, verstanden werden. In diesem 
Zusammenhang ist die Homokaryotisierung, die Herstellung von Zellen, 
die nur einheitliche Kerne enthalten, d. h. Kerne mit gleichem genetischem 
Informationsgehalt. 

10 

Diese Homokaryotisierung ist nur notwendig, wenn die durch Transforma- 
tion eingefOhrte genetische Information rezessiv vorliegt, d. h. nicht zur 
Auspragung gelangt. FOhrt die Transformation aber zu einem dominanten 
Vorliegen der genetischen Information, d. h. wird sie ausgepragt, so ist 
15 eine Homokaryotisierung nicht unbedingt n6tig. 

Vorzugsweise wird zur Homokaryotisierung eine Selektion der einkernigen 
Sporen durchgefOhrt. Von Natur aus ist ein geringer Anteil der Sporen von 
Blakeslea trispora einkernig, so dass sich diese ggf. nach spezifischer 
20 Markierung z. B. Farbung der Zellkeme aussortieren lassen. Dies wird be- 
vorzugterweise mittels FACS (Fluorescence Activated Cell Sorting) an- 
hand der geringeren Fluoreszenz der einkernigen Zellen durchgefOhrt. 

Aiternativ kann zur Homokaryotisierung zunachst eine Kernreduktion 
25 durchgefOhrt werden. Hierzu kann ein mutagenes Agens eingesetzt wer- 
den, wobei es sich insbesondere urn N-Methyl-N'-nitro-nitrosoguanidin 
(MNNG) handelt. Auch die Verwendung von energiereichen Strahlen, wie 
UV- oder Rontgen-Strahlen zur Kernreduktion ist mdglich. Anschliellend 
kann zur Selektion auf das FACS Verfahren oder rezessive Selektions- 
30 marker zurOckgegriffen werden. 
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Unter Selektion wird die Auswahl von Zellen verstanden, deren Kerne die- 
selbe genetische Information beinhalten, d. h. Zellen die die gleichen Ei- 
genschaften aufweisen, wie Resistenzen oder die Herstellung bzw. ver- 
mehrte Herstellung eines Produktes. In der Selektion werden neben der 
5 FACS Methode bevorzugt 5-Carbon-5-deazariboflavin (DARF) und Hy- 
gromycin (hyg) oder 5'-Fluororotat (FOA) und Uracil eingesetzt. 

Der in der Transformation (i) eingesetzte Vector kann derart gestaltet sein, 
dass die im Vector enthaltene genetische Information in das Genom min- 

10 destens einer Zelle integriert wird. Dabei kann genetische Information in 
der Zelle ausgeschaltet werden. Dies kann direkt, d. h. durch eine Deletion 
erfolgen. Es ist aber auch m6glich, dafi der in der Transformation (i) ein- 
gesetzte Vector derart ausgestaltet ist, dass die im Vector enthaltene ge- 
netische Information in der Zelle exprimiert wird, d. h. genetische Informa- 

15 tion eingefugt wird, die im korrespondierenden Wildtyp nicht vorhanden ist 
oder die durch die Transformation verstarkt bzw. uberexprimiert wird und 
deren Produkt das Gen ausschaltet. Die eingefuhrte genetische Informati- 
on kann aber auch indirekt eine genetische Information in der Zelle aus- 
schalten, z. B. durch Produktion eines Inhibitors. 

20 

Der eingesetzte Vector enthalt genetische Informationen oder Teile der 
genetischen Information zur Herstellung von Carotinoiden oder deren Vor- 
stufen, insbesondere Carotinen oder Xanthophyllen oder deren Vorstufen. 
Der eingesetzte Vector enthalt vorzugsweise genetische Informationen zur 
25 Herstellung von Astaxanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, p- 
Carotin, Andonixanthin, Adonirubin, Canthaxanthin, 3-Hydroxyechinenon, 
3'-Hydroxyechinenon, Lycopiri, Lutein, Bixin oder Phytoen. Ganz beson- 
ders bevorzugt enthalt der Vector Informationen zur Herstellung von Bixin, 
Phytoen, Canthaxanthin, Astaxanthin oder Zeaxanthin. 

30 
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Der Vector kann beliebige genetische Informatiorten zur genetischen Ver- 
anderungen von Organismen der Gattung Blakeslea enthalten. 

Unter ..genetischer information" werden vorzugsweise Nukleinsauren ver- 
5 standen, deren Einbringung in den Organismus der Gattung Blakeslea zu 
einer genetischen Veranderung in Organismen der Gattung Blakeslea, 
also beispielsweise zu einer Verursachung, ErhShung oder Reduzierung 
von Enzymaktivitaten im Vergleich zum Ausgangsorganismus ftlhren. 

10 Der Vector kann beispielsweise genetische Information zur Herstellung 
lipophiler Substanzen enthalten wie z.B. Carotinoide und deren Vorstufen, 
Phospholipide, Triacylglyceride, Steroide, Wachse, fettlosliche Vitamine, 
Provitamine und Cofaktoren oder genetische Information zur Herstellung 
hydrophiler Substanzen wie z.B. Eiweilie, Aminosauren, Nukleotide und 

15 wasserlosliche Vitaminen, Provitamine und Cofaktoren. 

Bevorzugterweise enthalt der eingesetzte Vector genetische Informationen 
zur Herstellung von Carotinoiden oder Xanthophyllen oder deren Vorstu- 
fen. 

20 

Bevorzugterweise enthalt der Vektor genetische Information, die eine Lo- 
kalisierung der Carotinoidbiosynthese-Enzyme in dem Zellkompartiment 
bewirkt, in dem die Carotinoidbiosynthese stattfindet. 

25 Besonders bevorzugt sind genetische Informationen zur Herstellung von 
Astaxanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, Andonixanthin, 
Adonirubin, Canthaxanthin, 3- und 3-Hydroxyechinenon, Lycopin, Lutein, 
p-Carotin, Phytoen und/oder Phytofluen. Ganz besonders bevorzugt sind 
genetische Informationen zur Herstellung von Phytoen, Bixin, Lycopin, 

30 Zeaxanthin, Canthaxanthin und/oder Astaxanthin. 
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Entsprechend werden in einer bevorzugten Variante der Erfindung Orga- 
nismen hergestellt und kultiviert, die Uber eine erhohte Syntheserate fur 
Zwischenprodukte der Carotinoidbiosynthese verfugen und fojglich eine 
erhohte Produktivitat fQr Endprodukte der Carotinoidbiosynthese aufwei- 
5 sen. Zur ErhQhung der Syntheserate fQr Zwischenprodukte der Caroti- 
noidbiosynthese werden insbesondere die Aktivitaten der Enzyme 3- 
Hydroxy-3-Methyl-Glutaiyl-Coenzym-A-Reduktase (HMG-CoA- 
Reduktase), Isopentenylpyrophosphat-lsomerase und Geranylpy- 
rophosphatsynthase gesteigert. 

10 

Entsprechend werden in einer besonders bevorzugten Variante der Erfin- 
dung Organismen hergestellt und kultiviert, die gegeniiber dem Wildtyp 
eine erhohte HMG-CoA-Reduktase-Aktivitat aufweisen. 

15 Unter HMG-CoA-Reduktase-nAktivitat wird die Enzymaktivitat einer HMG- 
CoA-Reduktase (3-Hydroxy-3-Methyl-Glutaryl-Coenzym-A-Reduktase) 
verstanden. 

Unter einer HMG-CoA-Reduktase wird ein Protein verstanden, das 
die enzymatische Aktivitat aufweist 3-Hydroxy-3-Methyl-Glutaryl- 
20 Coenzym-A in Mevalonat umzuwandeln. 

Dementsprechend wird unter HMG-CoA-Reduktase-Aktivitat die in einer 
bestimmten Zeit durch das Protein HMG-CoA-Reduktase umgesetzte 
Menge 3-Hydroxy-3-Methyl-Glutaryl-Coenzym-A bzw. gebildete Menge 
25 Mevalonat verstanden. 

Bei einer erhohten HMG-CoA-Reduktase-Aktivitat gegenuber dem Wildtyp 
wird somit im Vergleich zum Wildtyp in einer bestimmten Zeit durch das 
Protein HMG-CoA-Reduktase die umgesetzte Menge 3-Hydroxy-3-Methyl- 
30 Glutaryl-Coenzym-A bzw. die gebildete Menge Mevalonat erhoht. 
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Vorzugsweise betragt diese ErhOhung der HMG-CoA-Reduktase-Aktivitat 
mindestens 5%, weiter bevorzugt mindestens 20%, weiter bevorzugt min- 
destens 50%, weiter bevorzugt mindestens 100%, besonders bevorzugt 
mindestens 300%, noch bevorzugter mindestens 500%, insbesondere 
5 mindestens 600% der HMG-CoA-Reduktase-Aktivitat des Wildtyps. 

In einer bevorzugten AusfQhrungsform erfolgt die Erhohung der HMG- 
CoA-Reduktase-Aktivitat gegenOber dem Wildtyp durch eine Erhohung der 
Genexpression einer Nukieinsaure codierend eine HMG-CoA-Reduktase. 

10 

In einer besonders bevorzugten AusfQhrungsform des erfindungsgemalien 
Verfahrens erfolgt die Erhohung der Genexpression einer Nukieinsaure 
codierend eine HMG-CoA-Reduktase indem man ein Nukleinsaurekon- 
strukt, enthattend eine Nukieinsaure codierend eine HMG-CoA-Reduktase 
15 in den Organismus einbringt, deren Expression in dem Organismus, ver- 
glichen mit dem Wildtyp, einer reduzierten Regulation unteriiegt. 

Unter einer reduzierten Regulation verglichen mit dem Wildtyp, wird eine 
im Vergleich zum vorstehend definierten Wildtyp verringerte, vorzugsweise 
20 keine Regulation auf Expressions- oder Proteinebene verstanden. 

Die reduzierte Regulation kann vorzugsweise durch einen im Nukleinsau- 
rekonstrukt mit der kodierenden Sequenzfunktionell verknOpften Promotor 
erreicht werden, der in dem Organismus verglichen mit dem Wildtyp- 
25 Promoter einer reduzierten Regulation unteriiegt. 

Beispielsweise unterliegen die Promotoren ptefl aus Blakeslea trispora 
und pgpdA aus Aspergillus nidulans nur einer reduzierten Regulation und 
sind daher insbesondere als Promotoren bevorzugt. 
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Diese Promotoren zeigen eine annahernd konstitutive Expression in Bla- 
keslea trispora, so dass die transkriptionelle Regulation nicht mehr Qber 
die Intermediate der Carotinoidbiosynthese ablauft. 

5 Die reduzierte Regulation kann in einer weiteren bevorzugten Ausfuh- 
rungsform dadurch erreicht werden, dass man als Nukleinsaure codierend 
eine HMG-CoA-Reduktase eine Nukleinsaure verwendet, deren Expressi- 
on in dem Organismus, verglichen mit der Organismus eigenen, ortholo- 
gen Nukleinsaure, einer reduzierten Regulation unterliegt. 

10 

Besonders bevorzugt ist die Verwendung einer Nukleinsaure, die nur den 
katalytischen Bereich der HMG-CoA-Reduktase kodiert (trunkierte (t- 
)HMG-CoA-Reduktase). Die fur die Regulation verantwortliche Membran- 
Domane fehlt. Die verwendete Nukleinsaure unterliegt somit einer redu- 
15 zierten Regulation und ftthrt zu einer ErhShung der Genexpression der 
HMG-CoA-Reduktase . 

In einer besonders bevorzugten Ausfuhrungsform bringt man NukleinsSu- 
ren in Blakeslea trispora ein, welche die Sequenz SEQ ID. NO. 75 enthal- 
20 ten. 

Weitere Beispiele fur HMG-CoA-Reduktasen und damit auch fQr die auf 
den katalytischen Bereich reduzierten t-HMG-CoA-Reduktasen bzw. die 
kodierenden Gene lassen sich beispielsweise aus verschiedenen Orga- 
25 nismen, deren genomische Sequenz bekannt ist, durch Homologieverglei- 
che der Sequenzen aus Datenbanken mit der SEQ ID. NO. 75 leicht auf- 
finden. 

Weitere Beispiele fur HMG-CoA-Reduktasen und damit auch fur die auf 
30 den katalytischen Bereich reduzierten t-HMG-CoA-Reduktasen bzw. die 
kodierenden Gene lassen sich weiterhin beispielsweise ausgehend von 
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der Sequenz SEQ ID. NO. 75 aus verschiedenen Organismen deren ge- 
nomische Sequenz nicht bekannt ist, durch Hybridisierungs- und PCR- 
Techniken in an sich bekannter Weise leicht auffinden. 

5 In einer besonders bevorzugten Ausfuhrungsform wird die reduzierte Re- 
gulation dadurch erreicht, dass man als Nukleinsaure codierend eine 
HMG-CoA-Reduktase eine Nukleinsaure verwendet, deren Expression in 
dem Organismus, verglichen mit der Organismus eigenen, orthologen Nu- 
kleinsaure, einer reduzierten Regulation unterliegt und einen Promotor 

10 verwendet, der in dem Organismus, verglichen mit dem Wildtyp-Promoter 
einer reduzierten Regulation unterliegt. 

Entsprechend wird in einer bevorzugten Variante der Erfindung durch die 
Transformation die Genexpression der Phytoendesaturase ausgeschaltet, 
15 so dass das von den Organismen produzierte Phytoen gewonnen werden 
kann. Der in der Transformation (i) eingesetzte Vector umfasst daher in 
einer AusfQhrungsform der Erfindung bevorzugterweise eine Sequenz co- 
dierend fur ein Fragment des Gens der Phytoendesaturase, insbesondere 
carB aus Blakeslea trispora mit der SEQ ID NO: 69. 

20 

Entsprechend wird in einer bevorzugten Variante der Erfindung durch 
Transformation die Genexpression der Lycopincyclase ausgeschaltet, so 
dass das von den Organismen produzierte Lycopin gewonnen werden 
kann. Der in der Transformation eingesetzte Vektor umfasst daher in einer 
25 AusfQhrungsform der Erfindung bevorzugterweise eine Sequenz codie- 
rend fQr ein Fragment des Gens der Lycopincyclase, insbesondere carR 
aus Blakeslea trispora. 

30 In einer bevorzugten AusfQhrungsform werden die Organismen der Gat- 
tung Blakeslea beispielsweise dadurch in die Lage versetzt Xanthophylle, 
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wie beispielsweise Canthaxanthin, Zeaxanthin oder Astaxanthin herzustel- 
len, Bixin oder Phytoen, indem in den genetisch veranderten Organismen 
der Gattung Blakeslea im Vergleich zum Wildtyp eine Hydroxylase- 
Aktivitat und/oder Ketolase-Aktivitat verursacht wird. 

5 

Der in der Transformation (i) eingesetzte Vector enthalt also in einer weite- 
ren, bevorzugten Variante der Erfindung genetische Informationen, die 
nach Expression eine Ketolase- und/oder Hydroxylase-Aktivitat entfalten, 
so dass die Organismen Zeaxanthin oder Astaxanthin produzieren. 

10 

Unter Ketolase-Aktivitat wird die Enzymaktivitat einer Ketolase verstan- 
den. 

Unter einer Ketolase wird ein Protein verstanden, das die enzymatische 
15 Aktivitat aufweist, am, gegebenenfalls substituierten, p-lonon-Ring von 
Carotinoiden eine Keto-Gruppe einzufQhren. 

Insbesondere wird unter einer Ketolase ein Protein verstanden, das die 
enzymatische Aktivitat aufweist, p-Carotin in Canthaxanthin umzuwandeln. 

20 

Dementsprechend wird unter Ketolase-Aktivitat die in einer bestimmten 
Zeit durch das Protein Ketolase umgesetzte Menge p-Carotin bzw. gebil- 
dete Menge Canthaxanthin verstanden. 

25 Unter dem Begriff "Wildtyp" wird erfindungsgemali der entsprechende 
nicht genetisch veranderte Ausgangsorganismus der Gattung Blakesleaa 
verstanden. 

Je nach Zusammenhang kann unter dem Begriff "Organismus" der Aus- 
30 gangsorganismus (Wildtyp) der Gattung Blakesleaa oder ein erfindungs- 
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gemalier, genetisch veranderter Organismus der Gattung Blakesleaa oder 
beides verstanden werden. 

Vorzugsweise wird unter "Wildtyp" fQr die Verursachung der Ketolase- 
5 Aktivitat und fur die Verursachung der Hydroxylase-Aktivitat jeweils eine 
Referenz Organismus verstanden. 

Dieser Referenzorganismus der Gattung Blakeslea ist Blakeslea trispora 
ATCC 14271 Oder ATCC 14272, die sich lediglich im Paarungstyp unter- 
10 scheiden. 

Die Bestimmung der Ketolase-Aktivitat in erfindungsgemalJen genetisch 
veranderten Organismen der Gattung Blakesleaa und in Wildtyp- bzw. Re- 
ferenzorganismen erfolgt vorzugsweise unter folgenden Bedingungen: 

15 

Die Bestimmung der Ketolase-Aktivitat in Organismen der Gattung Blakes- 
lea erfolgt in Anlehnung an die Methode von Frazer et al., (J. Biol. Chem. 
272(10): 6128-6135, 1997). Die Ketolase-Aktivitat in Extrakten wird mit 
den Substraten beta-Carotin und Canthaxanthin in Gegenwart von Lipid 
20 (Sojalecithin) und Detergens (Natriumcholat) bestimmt. Substrat/Produkt- 
Verhaltnisse aus den Ketolase-Assays werden mittels HPLC ermittelt. 

Der erfindungsgemade genetisch veranderte Organismus der Gattung 
Blakesleaa weist in dieser, bevorzugten Ausfuhrungsform im Vergleich 
25 zum genetisch nicht veranderten Wildtyp eine Ketolase-Aktivitat auf und ist 
somit vorzugsweise in der Lage, transgen eine Ketolase zu exprimieren. 

In einer weiter bevorzugten AusfQhrungsform erfolgt die Verursachung der 
Ketolase-Aktivitat in den Organismen der Gattung Blakesleaa durch Ver- 
30 ursachung der Genexpression einer Nukleinsaure kodierend eine Ketola- 
se. 



WO 2004/063359 



24 



PCT/EP2004/000099 



In dieser bevorzugten Ausfuhrungsform erfoigt die Verursachung der Ge- 
nexpression einer Nukleinsaure kodierend eine Ketolase vorzugsweise 
durch Einbringen von Nukleinsauren, die Ketolasen kodieren in die Aus- 
5 gangsorganismus der Gattung Blakesleaa. 

Dazu kann prinzipiell jedes Ketolase-Gen, also jede Nukleinsauren die 
eine Ketolase codiert verwendetwerden. 

10 Alle in der Beschreibung erwahnten Nukleinsauren konnen beispielsweise 
eine RNA-, DNA- oder cDNA-Sequenz sein. 

Bei genomischen Ketolase-Sequenzen aus eukaryontischen Quellen, die 
Introns enthalten, sind fur den Fall das der Wirtsorganismus der Gattung 
15 Blakesleaa nicht in der Lage ist oder nicht in die Lage versetzt werden 
kann, die entsprechenden Ketolase zu exprimieren, bevorzugt bereits pro- 
zessierte Nukleinsauresequenzen, wie die entsprechenden cDNAs zu 
verwenden. 

20 Beispiele fQr Nukleinsauren, kodierend eine Ketolase und die entspre- 
chenden Ketolasen, die im erfindungsgemaBen Verfahren verwendet wer- 
den kQnnen sind beispielsweise Sequenzen aus: 

Haematoccus pluvialis, insbesondere aus Haematoccus pluvialis Flotow 
25 em. Wille (Accession NO: X86782; Nukleinsaure: SEQ ID NO: 1 1 , Protein 
SEQ ID NO: 12), 

Haematoccus pluvialis, NIES-144 (Accession NO: D45881; Nukleinsaure: 
SEQ ID NO: 13, Protein SEQ ID NO: 14), 

30 
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Agrobacterium aurantiacum (Accession NO: D58420; Nukleinsaure: SEQ 
ID NO: 15, Protein SEQ ID NO: 16), 

Alicaligenes spec. (Accession NO: D58422; Nukleinsaure: SEQ ID NO: 17, 
5 Protein SEQ ID NO: 18), 

Paracoccus marcusii (Accession NO: Y15112; Nukleinsaure: SEQ ID NO: 
19, Protein SEQ ID NO: 20). 

10 Synechocystis sp. Strain PC6803 (Accession NO: NP442491 ; Nukleinsau- 
re: SEQ ID NO: 21, Protein SEQ ID NO: 22). 

Bradyrhizobium sp. (Accession NO: AF218415; Nukleinsaure: SEQ ID NO: 
23, Protein SEQ ID NO: 24). 

15 

Nostoc sp. Strain PCC7120 (Accession NO: AP003592, BAB74888; Nu- 
kleinsaure: SEQ ID NO: 25, Protein SEQ ID NO: 26), 

Nostoc punctiforme ATTC 29133, Nukleinsaure: Acc.-No. 
20 NZ_AABC01 0001 95, Basenpaar 55,604 bis 55,392 (SEQ ID NO: 27); Pro- 
tein: Acc.-No. ZP_001 1 1258 (SEQ ID NO: 28) (als putatives Protein an- 
notiert), 

Nostoc punctiforme ATTC 29133, Nukleinsaure: Acc.-No. 
25 NZ_AABC01000196, Basenpaar 140,571 bis 139,810 (SEQ ID NO: 29), 
Protein: (SEQ ID NO: 30) (nicht annotiert), 

Weitere natOrliche Beispiele filr Ketolasen und Ketolase-Gene, die im er- 
findungsgemaiJen Verfahren verwendet werden kSnnen, lassen sich bei- 
30 spielsweise aus verschiedenen Organismen, deren genomische Sequenz 
bekannt ist, durch Identitatsvergleiche der Aminosauresequenzen oder der 
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entsprechenden rttckObersetzten Nukleinsauresequenzen aus Datenban- 
ken mit den vorstehend beschriebenen Sequenzen und insbesondere mit 
den Sequenzen SEQ ID NO: 12, 26 und/oder 33 leicht auffinden. 

5 Weitere naturiiche Beispiele fur Ketolasen und Ketolase-Gene lassen sich 
weiterhin ausgehend von den vorstehend beschriebenen Nukleinsaurese- 
quenzen, insbesondere ausgehend von den Sequenzen SEQ ID NO: 12, 
26 und/oder 30 aus verschiedenen Organismen, deren genomische Se- 
quenz nicht bekannt ist, durch Hybridisierungstechniken in an sich be- 

10 kannter Weise leicht auffinden. 

Die Hybridisierung kann unter moderaten (geringe Stringenz) Oder vor- 
zugsweise unter stringenten (hohe Stringenz) Bedingungen erfolgen. 

15 Solche Hybridisierungsbedingungen sind beispielsweise bei Sambrook, J., 
Fritsch, E.F., Maniatis, T., in: Molecular Cloning (A Laboratory Manual), 2. 
Auflage, Cold Spring Harbor Laboratory Press, 1989, Seiten 9.31-9.57 
Oder in Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. 
(1989), 6.3.1-6.3.6 beschrieben. 

20 

Beispielhaft kdnnen die Bedingungen wahrend des Waschschrittes aus- 
gewahlt sein aus dem Bereich von Bedingungen begrenzt von solchen mit 
geringer Stringenz (mit 2X SSC bei 50_C) und solchen mit hoher Strin- 
genz (mit 0.2X SSC bei 50_C, bevorzugt bei 65_C) (20X SSC: 0,3 M Na- 
25 triumcitrat, 3 M Natriumchlorid, pH 7.0). 

DarOberhinaus kann die Temperatur wahrend des Waschschrittes von 
moderaten Bedingungen bei Raumtemperatur, 22°C, bis zu stringenten 
Bedingungen bei 65°C angehoben werden. 
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Beide Parameter, Salzkonzentration und Temperatur, k6nnen gleichzeitig 
variiert werden, auch kann einer der beiden Parameter konstant gehalten 
und nur der andere variiert werden. Wahrend der Hybridisierung konnen 
auch denaturierende Agenzien wie zum Beispiel Formamid oder SDS ein- 
5 gesetzt werden. In Gegenwart von 50% Formamid wird die Hybridisierung 
bevorzugt bei 42°C ausgefQhrt. 

Einige beispielhafte Bedingungen fur Hybridisierung und Waschschritt sind 
infolge gegeben: 

10 

(1) Hybridiserungsbedingungen mit zum Beispiel 
* (i) 4X SSC bei 65°C, oder 

(ii) 6X SSC bei 45°C, oder 

(iii) 6X SSC bei 68°C, 100 mg/ml denaturierter Fischsperma-DNA, oder 
15 (iv) 6X SSC, 0.5 % SDS, 100 mg/ml denaturierte, fragmentierte Lachs- 

sperma-DNA bei 68°C, oder 

(v) 6XSSC, 0.5 % SDS, 100 mg/ml denaturierte, fragmentierte Lachs- 
sperma-DNA, 50 % Formamid bei 42°C, oder 

(vi) 50 % Formamid, 4X SSC bei 42°C, oder 

20 (vii) 50 % (vol/vol) Formamid, 0.1 % Rinderserumalbumin, 0.1 % Ficoll, 
0.1 % Polyvinylpyrrolidon, 50 mM Natriumphosphatpuffer pH 6.5, 750 mM 
NaCI, 75 mM Natriumcitrat bei 42°C, oder 

(viii) 2X oder 4X SSC bei 50°C (moderate Bedingungen), oder 

(ix) 30 bis 40 % Formamid, 2X oder 4X SSC bei 42°C (moderate Be- 
25 dingungen). 



(2) Waschschritte fur jeweils 10 Minuten mit zum Beispiel 

(i) 0.015 M NaCI/0.0015 M Natriumcitrat/0.1 % SDS bei 50°C, oder 

(ii) 0.1 X SSC bei 65°C, oder 

30 (iii) 0.1X SSC, 0.5 % SDS bei 68°C, oder 

(iv) 0.1X SSC, 0.5 % SDS, 50 % Formamid bei 42°C, oder 
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(v) 0.2X SSC, 0.1 % SDS bei 42°C, Oder 

(vi) 2X SSC bei 65°C (moderate Bedingungen). 

In einer bevorzugten AusfOhrungsform der erfindungsgemalien genetisch 
5 veranderten Organismen-der Gattung Blakeslea bringt man Nukleinsauren 
ein, die ein Protein kodieren, enthaltend die Aminosauresequenz SEQ ID 
NO: 12 oder eine von dieser Sequenz durch Substitution, Insertion oder 
Deletion von Aminosauren abgeleitete Sequenz, die eine Identitat von 
mindestens 20 %, vorzugsweise mindestens 30%, 40%, 50%, 60%, be- 
10 vorzugt mindestens 70%, 80%, besonders bevorzugt mindestens 90%, 
insbesondere 91%, 92%; 93%, 94%, 95%, 96%, 97%, 98% oder 99% auf 
Aminosaureebene mit der Sequenz SEQ ID NO: 12 und die enzymatische 
Eigenschaft einer Ketolase aufweist. 

15 Dabei kann es sich um eine natiirliche Ketolase-Sequenz handeln, die wie 
vorstehend beschrieben durch Identitatsvergleich der Sequenzen aus an- 
deren Organismen gefunden werden kann oder um eine kunstliche Keto- 
lase-Sequenz die ausgehend von der Sequenz SEQ ID NO: 12 durch 
kunstliche Variation, beispielsweise durch Substitution, Insertion oder De- 

20 letion von Aminosauren abgewandelt wurde. 

In einer weiteren, bevorzugten Ausfuhrungsform der erfindungsgemaften 
Verfahren bringt man Nukleinsauren ein die ein Protein kodieren, enthal- 
tend die Aminosauresequenz SEQ ID NO: 26 oder eine von dieser Se- 

25 quenz durch Substitution, Insertion oder Deletion von Aminosauren abge- 
leitete Sequenz, die eine Identitat von mindestens 20 %, vorzugsweise 
mindestens 30%, 40%, 50%, 60%, bevorzugt mindestens 70%, 80%, be- 
sonders bevorzugt mindestens 90%, insbesondere 91%, 92%; 93%, 94%, 
95%, 96%, 97%, 98% oder 99% auf Aminosaureebene mit der Sequenz 

30 SEQ ID NO: 26 und die enzymatische Eigenschaft einer Ketolase auf- 
weist. 
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Dabei kann es sich urn eine natGrliche Ketolase-Sequenz handeln, die, 
wie vorstehend beschrieben, durch Identitatsvergleich der Sequenzen aus 
anderen Organismen gefunden werden kann oder um eine kQnstliche Ke- 
5 tolase-Sequenz die ausgehend von der Sequenz SEQ ID NO: 26 durch 
kQnstliche Variation, beispielsweise durch Substitution, Insertion oder De- 
letion von Aminosauren abgewandelt wurde. 

In einer weiteren, bevorzugten AusfQhrungsform der erfindungsgemaiien 
10 Verfahren bringt man Nukleinsauren ein die ein Protein kodieren, enthal- 
tend die AminosSuresequenz SEQ ID NO: 30 oder eine von dieser Se- 
quenz durch Substitution, Insertion oder Deletion von Aminosauren abge- 
leitete Sequenz, die eine Identitat von mindestens 20 %, vorzugsweise 
mindestens 30 %, 40 %, 50 %, bevorzugt mindestens 60 %, 70 %, bevor- 
15 zugter mindestens 80 %, 85 % besonders bevorzugt mindestens 90 %, 
insbesondere 91 %, 92 %, 93 %, 94 %, 95^%, 96 %, 97 %, 98 %, 99 % auf 
Aminosaureebene mit der Sequenz SEQ ID NO 30 und die enzymatische 
Eigenschaft einer Ketolase aufweist. 

20 Dabei kann es sich um eine naturliche Ketolase-Sequenz handeln, die, 
wie vorstehend beschrieben, durch Identitatsvergleich der Sequenzen aus 
anderen Organismen gefunden werden kann oder um eine kQnstliche Ke- 
tolase-Sequenz die ausgehend von der Sequenz SEQ ID NO: 30 durch 
kQnstliche Variation, beispielsweise durch Substitution, Insertion oder De- 

25 letion von Aminosauren abgewandelt wurde. 

Unter dem Begriff "Substitution" ist in der Beschreibung der Austausch 
einer oder mehrerer Aminosauren durch eine oder mehrere Aminosauren 
zu verstehen. Bevorzugt werden sog. konservative Austausche durchge- 
30 fQhrt, bei denen die ersetzte Aminosaure eine ahnliche Eigenschaft hat 
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wie die ursprtlngliche Aminosaure, beispielsweise Austausch von Glu 
durch Asp, Gin durch Asn, Val durch He, Leu durch He, Ser durch Thr. 

Deletion ist das Ersetzen einer Aminosaure durch eine direkte Bindung. 
5 Bevorzugte Positionen fur Deletionen sind die Termini des Polypeptides 
und die VerknQpfungen zwischen den einzelnen Proteindomanen. 

Insertionen sind EinfOgungen von Aminosauren in die Polypeptidkette, 
wobei formal eine direkte Bindung durch ein oder mehrere Aminosauren 
10 ersetzt wird. 

Unter Identitat zwischen zwei Proteinen wird die Identitat der Aminosauren 
Ober die jeweils gesamte Proteinlange verstanden, insbesondere die Iden- 
titat die durch Vergleich mit Hilfe der Lasergene Software der Firma 
15 DNASTAR, inc. Madison, Wisconsin (USA) unter Anwendung der Clustal 
Methode (Higgins DG, Sharp PM. Fast and sensitive multiple sequence 
alignments on a microcomputer. Comput Appl. Biosci. 1989 Apr;5(2):151- 
1) unter Einstellung folgender Parameter berechnet wird: 

20 Multiple alignment parameter: 



Gap penalty 10 

Gap length penalty 10' 
Pairwise alignment parameter: 

K-tuple 1 

25 Gap penalty 3 

Window 5 

Diagonals saved 5 



Unter einem Protein, das eine Identitat von mindestens 20% auf Amino- 
30 saureebene mit der Sequenz SEQ ID NO: 12 oder 26 oder 30 aufweist, 
wird dementsprechend ein Protein verstanden, das bei einem Vergleich 
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seiner Sequenz mit der Sequenz SEQ ID NO: 12 Oder 26 oder 30, insbe- 
sondere nach obigen Programmlogarithmus mit obigem Parametersatz 
eine Identitat von mindestens 20 %, bevorzugt 30%, 40%, 50%, beson- 
ders bevorzugt 60%, 70%, 80%, insbesondere 85%, 90, 95% aufweist. 

5 

Geeignete Nukleinsauresequenzen sind beispielsweise durch Ruckuber- 
setzung der Polypeptidsequenz gemSB dem genetischen Code erhaltlich. 

Bevorzugt werden dafur solche Codons verwendet, die entsprechend der 
10 Blakesleaaspezifischen codon usage hSufig verwendet werden. Die codon 
usage lasst sich anhand von Computerauswertungen anderer, bekannter 
Gene von Organismen der Gattung Blakesleaa leicht ermitteln. 

In einer besonders bevorzugten AusfQhrungsform bringt man eine Nu- 
ts kleinsaure, enthaltend die Sequenz SEQ ID NO: 11 in die Organismus der 
Gattung ein. 

In einer weiteren, besonders bevorzugten AusfQhrungsform bringt man 
eine NukleinsSure, enthaltend die Sequenz SEQ ID NO: 25 in die Orga- 
20 nismus der Gattung ein. 

In einer weiteren, besonders bevorzugten AusfQhrungsform bringt man 
eine Nukleinsaure, enthaltend die Sequenz SEQ ID NO: 29 in die Orga- 
nismus der Gattung ein. 

25 

Alle vorstehend erwahnten Ketoiase-Gene sind weiterhin in an sich be- 
kannter Weise durch chemische Synthese aus den Nukleotidbausteinen 
wie beispielsweise durch Fragmentkondensation einzelner uberlappender, 
komplementarer NukleinsSurebausteine der Doppelhelix herstellbar. Die 
30 chemische Synthese von Oligonukleotiden kann beispielsweise, in be- 
kannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 2. Auflage, 
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Wiley Press New York, S. 896-897) erfolgen. Die Anlagerung syntheti- 
scher Oligonukleotide und Auffullen von Lucken mithilfe des Klenow- 
Fragmentes der DNA-Polymerase und Ligationsreaktionen sowie allge- 
meine Klonierungsverfahren werden in Sambrook et al. (1989), Molecular 
5 cloning: A laboratory manual, Cold Spring Harbor Laboratory Press, 
beschrieben. 

Der in der Transformation (i) eingesetzte Vector umfasst daher in einer 
AusfQhrungsform der Erfindung bevorzugterweise eine Sequenz codie- 
10 rend fur eine Ketolase, insbesondere der Ketolase Nostoc punctiforme aus 
mit der SEQ ID NO: 72. 

Unter Hydroxylase-Aktivitat die Enzymaktivitat einer Hydroxylase verstan- 
den. 

15 

Unter einer Hydroxylase wird ein Protein verstanden, das die enzymati- 
sche Aktivitat aufweist, am, gegebenenfalls substituierten, p-Ionon-Ring 
von Carotinoiden eine Hydroxy-Gruppe einzufuhren. 

20 Insbesondere wird unter einer Hydroxylase ein Protein verstanden, das 
die enzymatische Aktivitat aufweist, p-Carotin in Zeaxanthin oder Canta- 
xanthin in Astaxanthin umzuwandeln. 

Dementsprechend wird unter Hydroxyase-Aktivitat die in einer bestimmten 
25 Zeit durch das Protein Hydroxylase umgesetzte Menge p-Carotin oder 
Cantaxanthin bzw. gebildete Menge Zeaxanthin oder Astaxanthin verstan- 
den. 

Bei einer erhohten Hydroxylase-Aktivitat gegenQber dem Wildtyp wird 
30 somit im Vergleich zum Wildtyp in einer bestimmten Zeit durch das Protein 
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Hydroxylase die umgesetzte Menge p-Carotin oder Cantaxantin bzw. die 
gebiidete Menge Zeaxanthin oder Astaxanthin erhoht. 

Vorzugsweise betragt diese Erhohung der Hydroxylase-Aktivitat minde- 
5 stens 5 %, weiter bevorzugt mindestens 20 %, weiter bevorzugt minde- 
stens 50 %, weiter bevorzugt mindestens 100 %, bevorzugter mindestens 
300 %, noch bevorzugter mindestens 500 %, insbesondere mindestens 
600 % der Hydroxylase-Aktivitat des Wildtyps. 

10 Die Bestimmung der Hydroxylase-Aktivitat in erfindungsgemaBen gene- 
tisch veranderten Organismen und in Wildtyp- bzw. ReferenzOrganismen 
erfolgt vorzugsweise unter folgenden Bedingungen: 

Die Aktivitat der Hydroxylase wird nach Bouvier et al. (Biochim. Biophys. 
15 Acta 1391 (1998), 320-328) in vitro bestimmt. Es wird zu einer bestimmten 
Menge an Organismenextrakt Fertedoxin, Ferredoxin-NADP Oxidoreduc- 
tase, Katalase, NADPH sowie beta-Carotin mit Mono- und Digalaktosyl- 
glyzeriden zugegeben. 

20 Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase-Aktivitat 
unter folgenden Bedingungen nach Bouvier, Keller, d'Harlingue und Ca- 
mara (Xanthophyll biosynthesis: molecular and functional characterization 
of carotenoid hydroxylases from pepper fruits (Capsicum annuum L.; Bio- 
chim. Biophys. Acta 1391 (1998), 320-328): 

25 

Der in-vitro Assay wird in einem Volumen von 0.250 ml Volumen durchge- 
fiihrt. Der Ansatz enthait 50 mM Kaliumphosphat (pH 7.6), 0.025 mg Fer- 
redoxin von Spinat, 0.5 Einheiten Ferredoxin-NADP+ Oxidoreduktase von 
Spinat, 0.25 mM NADPH, 0.010 mg beta-Carotin (in 0.1 mg Tween 80 
30 emulgiert), 0.05 mM eiher Mischung von Mono- und Digalaktosylglyzeri- 
den (1:1), 1 Einheit Katalyse, 200 Mono- und Digalaktosylglyzeriden, (1:1), 
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0.2 mg Rinderserumalbumin und Organismenextrakt in unterschiedlichem 
Volumen. Die Reaktionsmischung wird 2 Stunden bei 30C inkubiert. Die 
Reaktionsprodukte werden mit organischem Losungsmittel wie Aceton 
oder Ghloroform/Methanol (2:1) extrahiert und mittels HPLC bestimmt. 

5 

Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase-AktivitSt 
unter folgenden Bedingungen nach Bouvier, d'Harlingue und Camara (Mo- 
lecular Analysis of carotenoid cyclae inhibition; Arch. Biochem. Biophys. 
346(1) (1997) 53-64): 

10 

Der in-vitro Assay wird in einem Volumen von 250 Ol Volumen durchge- 
fiihrt. Der Ansatz enthait 50 mM Kaliumphosphat (pH 7.6),unterschiedliche 
Mengen an Organismenextrakt, 20 nM Lycopin, 250 Dg an chromoplasti- 
darem Stromaprotein aus Paprika, 0.2 mM NADP+, 0.2 mM NADPH und 1 
15 mM ATP. NADP/NADPH und ATP werden in 10 ml Ethanol mit 1 mg 
Tween 80 unmittelbar vor der Zugabe zum Inkubationsmedium gelSst. 
Nach einer Reaktionszeit von 60 Minuten bei 30C wird die Reaktion durch 
Zugabe von Chloroform/Methanol (2:1) beendet. Die in Chloroform extra- 
hierten Reaktionsprodukte werden mittels HPLC analysiert. 

20 

Ein altemativer Assay mit radioaktivem Substrat ist beschrieben in Fraser 
und Sandmann (Biochem. Biophys. Res. Comm. 185(1) (1992) 9-15). 

Die ErhShung der Hydroxylase-Aktivitat kann durch verschiedene Wege 
25 erfolgen, beispielsweise durch Ausschalten von hemmenden Regulati- 
onsmechanismen auf Expressions- und Proteinebene oder durch Erh6- 
hung der Genexpression von Nukleinsauren kodierend eine Hydroxylase 
gegenOber dem Wildtyp. 

30 Die ErhShung der Genexpression der Nukleinsauren kodierend eine Hy- 
droxylase gegenOber dem Wildtyp kann ebenfalls durch verschiedene 
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Wege erfolgen, beispielsweise durch Induzierung des Hydroxylase-Gens 
durch Aktivatoren oder durch Einbringen von einer oder mehrerer Hydro- 
xylase-Genkopien, also durch Einbringen mindestens einer Nukleinsaure 
kodierend eine Hydroxylase in denb Organismus der Gattung Blakesleaa. 

5 

In einer bevorzugten Ausftihrungsform erfolgt die ErhShung der Genex- 
pression einer Nukleinsaure kodierend eine Hydroxylase durch Einbringen 
von mindestens einer Nukleinsaure kodierend eine Hydroxylase in den 
Organismus der Gattung Blakesleaa. 

10 

Dazu kann prinzipiell jedes Hydroxylase-Gen, also jede Nukleinsaure, die 
eine Hydroxylase und jede Nukleinsaure, die eine p-Cyclase codiert, ver- 
wendet werden. 

15 Bei genomischen Hydroxylase-Sequenzen aus eukaryontischen Quellen, 
die Introns enthalten, sind fur den Fall das der Wirtsorganismus nicht in 
der Lage ist oder nicht in die Lage versetzt werden kann, die entspre- 
chende Hydroxylase zu exprimieren, bevorzugt bereits prozessierte Nu- 
kleinsauresequenzen, wie die entsprechenden cDNAs zu verwenden. 

20 

Ein Beispiel fur ein Hydroxylase-Gen ist eine Nukleinsaure, kodierend eine 
Hydroxylase aus Haematococcus pluvialis mit der Accession No. 
AX038729 (WO 0061764; Nukleinsaure: SEQ ID NO: 31, Protein: SEQ ID 
NO: 32), aus Erwinia uredovora 20D3 (ATCC 19321, Accession No. . 
25 D90087; Nukleinsaure: SEQ ID NO: 33, Protein: SEQ ID NO: 34) oder Hy- 
droxylase aus Thermus thermophilus (DE 102 34 126.5) kodiert durch die 
Sequenz mit der SEQ ID NO 76. 

sowie Hydroxylasen der folgenden Accession Nummern: 
30 |emb|CAB55626.1, CAA70427.1, CAA70888.1, CAB55625.1, 
AF499108_1, AF315289_1, AF296158_1, AAC49443.1, NP_194300.1, 
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NP_200070.1, AAG10430.1, CAC06712.1, AAM88619.1, CAC95130.1, 
AAL80006.1, AF162276_1, AA053295.1, AAN85601.1, CRTZ_ERWHE, 
CRTZ_PANAN, BAB79605.1, CRTZ_ALCSP. CRTZ_AGRAU, 
CAB56060.1, ZP_00094836.1, AAC44852.1, BAC77670.1, NP_745389.1, 
5 NP_344225.1, NP_849490.1, ZP_00087019.1, NP_503072.1, 
NP_852012.1, NP_1 15929.1, ZP_00013255.1 

In den erfindungsgemafien bevorzugten transgenen Organismen der Gat- 
tung Blakeslea liegt also in dleser bevorzugten Ausfuhrungsform gegen- 
10 Qber dem Wlldtyp mlndestens eln weiteres Hydroxylase-^Gen vor. 

In dieser bevorzugten Ausfuhrungsform weist die genetlsch veranderte 
Organismus beispielsweise mindestens eine exogene NukleinsSure, ko- 
dierend eine Hydroxylase oder mindestens zwei endogene Nukleinsauren, 
15 kodierend eine Hydroxylase auf . 

Bevorzugt verwendet man in vorstehend beschriebener bevorzugter Aus- 
fiihrungsform als Hydroxylase-Gene Nukleinsauren, die Proteine kodieren, 
enthaltend die Aminosauresequenz SEQ ID NO: 32, 34 oder kodiert durch 

20 die Sequenz mit der SEQ ID NO 76 oder eine von dieser Sequenz durch 
Substitution, Insertion oder Deletion von Aminosauren abgeleitete Se- 
quenz, die eine Identitat von mindestens 30 %, vorzugsweise mindestens 
50 %, bevorzugter mindestens 70%, noch bevorzugter mindestens 80 %, 
am bevorzugtesten mindestens 90%, insbesondere 91%, 92%, 93%, 94%, 

25 95%, 96%, 97%, 98%, 99% auf Aminosaureebene mit der Sequenz 
SEQ. ID. NO: 32, 34 oder kodiert durch die Sequenz mit der SEQ ID NO 
76 und die die enzymatische Eigenschaft einer Hydroxylase aufweisen. 

Weitere Beispiele fOr Hydroxylasen und Hydroxylase-Gene lassen sich 
30 beispielsweise aus verschiedenen Organismen, deren genomische Se- 
quenz bekannt ist, wie vorstehend beschrieben, durch Homologieverglei- 
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che der Aminosauresequenzen oder der entsprechenden riickQbersetzten 
NukleinsSuresequenzen aus Datenbanken mit der SEQ ID. NO: 31, 33 
oder 76 leicht auffinden. 

5 Weitere Beispiele fOr Hydroxylasen und Hydroxylase-Gene lassen sich 
weiterhin beispielsweise ausgehend von der Sequenz SEQ ID NO: 31, 33 
oder 76 aus verschiedenen Organismen deren genomische Sequenz nicht 
bekannt ist, wie vorstehend beschrieben, durch Hybridisierungs- und 
PCR-Techniken in an sich bekannter Weise leicht auffinden. 

10 

In einer weiter besonders bevorzugten AusfQhrungsform werden zur Erh6- 
hung der Hydroxylase-Aktivitat Nukleinsauren in Organismen eingebracht, 
die Proteine kodieren, enthaltend die AminosSuresequenz der Hydroxyla- 
se der Sequenz SEQ ID NO: 32, 34 oder kodiert durch die Sequenz mit 
15 der SEQ ID NO 76. 

Geeignete Nukleinsauresequenzen sind beispielsweise durch Ruckuber- 
setzung der Polypeptidsequenz gemSB dem genetischen Code erhaitlich. 

20 Bevorzugt werden dafQr solche Codons verwendet, die entsprechend der 
Organismenspezifischen codon usage haufig verwendet werden. Die co- 
don usage lasst sich anhand von Computerauswertungen anderer, be- 
kannter Gene der betreffenden Organismen leicht ermitteln. 

25 In einer besonders bevorzugten AusfQhrungsform bringt man eine Nu- 
kleinsaure, enthaltend die Sequenz SEQ. ID. NO: 31, 33 oder 76 in den 
Organismus ein. 

Alle vorstehend enA/§hnten Hydroxylase-Gene sind weiterhin in an sich 
30 bekannter Weise durch chemische Synthese aus den Nukleotidbausteinen 
wie beispielsweise durch Fragmentkondensation einzelner Qberlappender, 
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komplementarer Nukleinsaurebausteine der Doppelhelix herstellbar. Die 
chemische Synthese von Oligonukleotiden kann beispielsweise, in be- 
kannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 2. Auflage, 
Wiley Press New York, Seite 896-897) erfolgen. Die Anlagerung syntheti- 
5 scher Oligonukleotide und AuffQIIen von LQcken mithilfe des Klenow- 
Fragmentes der DNA-Polymerase und Ligationsreaktionen sowie allge- 
meine Klonierungsverfahren werden in Sambrook et al. (1989), Molecular 
cloning: A laboratory manual, Cold Spring Harbor Laboratory Press, 
beschrieben. 

10 

Der in der Transformation (i) eingesetzte Vector umfasst daher in weiteren 
AusfQhrungsformen der Erfindung bevorzugterweise eine Sequenz codie- 
rend fQr eine Hydroxlase, insbesondere eine Hydroxlase aus Haemato- 
coccus pluvialis mit der SEQ ID NO: 70 Oder eine Hydroxlase aus Erwinia 
15 uredova mit der SEQ ID NO: 71. oder eine Hydroxylase aus Thermus 
thermophilus kodiert durch die Sequenz mit der SEQ ID NO 76. 

Vorzugsweise wird durch die Transformation das Gen der Phytoendesatu- 
rase ausgeschaltet. 

20 

Der in der Transformation (i) eingesetzte Vector enthalt vorzugsweise fer- 
ner die Expression regelnde und unterstQtzende Berelche, insbesondere 
Promotoren und Terminatoren. 

25 Der in der Transformation (i) eingesetzte Vector enthalt vorzugsweise den 
gpd und/oder den ptefl Promotor und/oder den trpC Terminator. Diese 
haben sich zur Transformation der Blakeslea besonders bewahrt. Auch 
der Einsatz von dem Fachmann gelaufigen "inverted repeats" (IR, RSmpp 
Lexikon der Biotechnologie 1992, Thieme Veriag Stuttgart, Seite 407 "In- 

30 vers repetitive Sequenzen") zur Regelung der Expression bzw. Transkrip- 
tion liegt im Rahmen der Erfindung. 
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Vorteilhafterweise weist der im Vector eingesetzte gpd Promotor die Se- 
quenz SEQ ID NO: 1 auf. Vorteilhafterweise weist der im Vector 
eingesetzte trpC Terminator die Sequenz SEQ ID NO: 2 auf. 
5 Vorteilhafterweise weist der im Vector eingesetzte ptefl Promotor die 
Sequenz SEQ ID NO: 35 auf. 

Insbesondere werden dabei der gpd Promotor und der trpC Terminator 
aus Aspergillus nidulans und der ptefl Promotor aus Blakeslea trispora 
10 eingesetzt. 

Insbesondere enthalt der in der Transformation (i) eingesetzte Vector ein 
Resistenzgen. Bevorzugterweise handelt es sich urn ein Hygromycin- 
Resistenzgen (hph), insbesondere eines aus E. coli. Dieses Resistenzgen 
15 hat sich bei dem Nachweis der Transformation und Selektion der Zellen 
ais besonders geeignet herausgestellt. 

Als Promotor fur hph wird also bevorzugt p-gpdA, der Promotor der Glyce- 
rinaldehyd-3-phosphatdehydrogenase aus Aspergillus nidulans genutzt. 
20 Als Terminator fur hph wird bevorzugt t-trpC, der Terminator des Gens 
trpC, codierend fur Anthranilatsynthasekomponenten aus Aspergillus nidu- 
lans genutzt. 

Als Vectoren haben sich AbkSmmlinge des pBinAHyg Vectors als beson- 
25 ders geeignet herausgestellt. Der zur Transformation eingesetzte Vector 
umfasst also bevorzugterweise die SEQ ID NO: 3. 
Hinzu kommen je nach gewQnschtem Carotinoid oder dessen Vorstufe 
eine Sequenz codierend fur eine Hydroxylase, Ketolase, Phytoendesatu- 
rase usw. wie diese zuvor beschrieben wurden. Die Vectoren umfassen 
30 also in einer Ausfuhrugsform der Erfndung die Sequenz SEQ ID NO: 69 
codierend fur die Phytoendesaturase. Die Vectoren umfassen femer in 
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einer weiteren AusfOhrugsform der Erfndung die Sequenz SEQ ID NO: 72 
codierend f(ir eine Ketolase. Die Vectoren umfassen weiter in einer weite- 
ren AusfOhrugsform der Erfndung die Sequenz SEQ ID NO: 70 oder 71 
oder 76 codierend fQr eine Hydoxylase. Entsprechende Kombinationen 
5 der zuvorgenannten Sequenzen liegen ebenso im Rahmen der Erfindung. 
So umfasst der Vector in einer AusfOhrungsform sowohl eine Sequenz 
SEQ ID NO: 72 codierend fur eine Ketolase als auch die Sequenz SEQ ID 
NO: 70 oder 71 oder 76 codierend fur eine Hydoxylase und ermoglicht so 
die Herstellung von Astaxanthin. 

10 

Insbesondere sind Vectoren ausgewahlt aus der Gruppe bestehend aus 
den SEQ ID NO: 37 bis 51 und 62 im Rahmen der Erfindung einsetzbar. 

Die genetisch veranderten Organismen konnen zur Produktion von Caroti- 
15 noiden, Xanthophyllen oder deren Vorstufen, insbesondere Bixin, Phy- 
toen, Astaxanthin, Zeaxanthin und Canthaxanthin verwendet werden. 
Auch konnen neue, im Wildtyp natOrlicherweise nicht vorkommende Caro- 
tinoide durch Einbringung der entsprechenden genetischen Information 
von den gezielt genetisch veranderten Zellen bzw. dem durch sie gebilde- 
20 ten Mycel erzeugt und anschlieliend isoliert werden. 

Die gentechnisch verandertern Zellen werden nach der Selektion kultiviert, 
so daB Carotinoiden oder deren Vorstufen bereitgestellt werden konnen. 

25 Bevorzugterweise ist die Gewinnung von Carotinoiden oder deren Vorstu- 
fen mit den gezielt genetisch veranderten Zellen bzw. das durch sie gebil- 
dete Mycel moglich. 

Die Kultivierung der Organismen unterliegt keinen Besonderheiten. Vor- 
30 teilhafterweise werden, insbesondere bei der Verwendung von Blakeslea 
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trispora, entgegengesetzte Paarungstypen gemeinsam kultiviert, da dies 
zu besserem Wachstum und Produktion fQhrt. 

Wird die gentechnische VerSnderung nur in Zellen eines der vorkommen- 
5 den Paanjngstypen (bei Blakeslea trispora (+) oder (-)) durchgefuhrt, so 
wird zur Kuttivierung der entsprechend andere, nicht veranderte Paarungs- 
typ zugesetzt, da so eine gute Produktion der Carotinoide oder deren Vor- 
stufen aufgrund der von dem zweiten, nicht veranderten Paarungstyp ab- 
gegebenen Substanzen (z. B. Trisporsauren) zu erreichen ist. Vorteilhaft- 
10 erweise wird jedoch die gentechnische Veranderung in Zellen beider Paa- 
rungstypen vorgenommen und diese zusamnrien kultiviert. Hierdurch wird 
ein besonders gutes Wachstum und eine optimale Produktion der Caroti- 
noiden oder deren Vorstufen erreicht. Auch eine (kunstliche) Zugabe der 
Trisporsauren ist moglich und sinnvoll. 

15 

Trisporsauren sind Sexualhormone in Mucorales Pilzen, wie Blakeslea, 
welche die Bildung von Zygophoren und die Produktion von B-Carotin sti- 
mulieren (van den Ende 1968, J. Bacterid. 96:1298 - 1303, Austin et al. 
1969, Nature 223:1178 - 1179, Reschke Tetrahedron Lett. 29:3435 - 
20 3439, van den Ende 1 970, J. Bacteriol. 1 0 1 :423 - 428). 

Es konnen alle dem Fachmann gelaufigen Medien eingesetzt werden, so 
weit sich diese zur Kultivierung der eingesetzten Organismen und deren 
Carotinoid Produktion eigenen. Insbesondere mflssen bei Einsatz der 

25 GVO keine Carotinoidbiosynthese Inhibitoren eingesetzt werden. Die ein- 
gesetzten Medien beinhalten vorzugsweise Zusatze, wie eine oder mehre- 
re Kohlenstoffquellen, eine oder mehrere Stickstoffquellen, Mineralsalze 
und Thiamine. Bevorzugterweise werden Zusatze eingesetzt, wie sie aus 
der WO 03/038064 A2, Seite 4, Zeile 30 bis Seite 5 Zeile 7 hervorgehen. 

30 Besonders bevorzugt wird als Kohlenstoffquelle Glukose und als Stick- 
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stoffquelle Asparagin, pflanzliche oder tierische Extrakte, wie Baumwoll- 
saatSI, Sojaol, Baumwollsamenmehl oder Hefe-Extrakt zugesetzt. 

Die Kultivierung kann entweder unter aeroben oder anaeroben Bedingun- 
5 gen durchgefOhrt werden. Auch eine gemischte, zunachst aerobe und an- 
schlieliend anaerobe Kultivierung, wie sie aus der DE 101 30 323 bekannt 
ist, ist mdglich. Temperatur und Luftfeuchtigkeit werden dabei jeweils zum 
optimalen Wachstum eingestellt. Bevorzugterweise liegt die Temperatur 
bei der Kultivierung zwischen ca. 20 und ca. 34 °C, insbesondere zwi- 
10 schen ca. 26°C und ca. 28°C. Die Kultivierung kann ferner kontinuierlich, 
batch- oder satzweise erfolgen. 

Die Kultivierung erfolgt vorzugsweise bis zu einem Feststoffgehalt zwi- 
schen etwa 1 und etwa 20 %, bevorzugt 3 und 15 % und besonders be- 
ys vorzugt 4 und 1 1 %. Insbesondere ist wichtig dass die Kulturbrtihe pump- 
bar bleibt, so dass sie in den nachfolgenden Verfahrensschritten ver- und 
bearbeitbar bleibt. Ist der Feststoffgehalt zu klein, so muss ein grolier 
Aufwand bei der Aufkonzentrierung oder Trocknung betrieben werden. 

20 Die Kultivierung bzw. Fermentation kann in den iiblichen Apparaturen 
durchgefuhrt werden. Hierzu kommen alle fur die jeweils eingesetzten Mi- 
kroorganismen und deren Produkte geeigneten Apparaturen in Betracht. 
Insbesondere solche, wie sie aus dem Rompp Lexikon Biotechnologie 
(1992 Georg Thieme Verlag, Stuttgart) unter dem Stichwort "Bioreaktor" 

25 auf Seiten 123 r 126 angegeben sind. Besonders bevorzugt ist der Einsatz 
von RQhrkesselreaktoren mit versch. Einbauten, Blasensaulen verschie- 
dener Bauarten, etc. 

Die nach dem erfindungsgemaBen Verfahren bereitgestellten Carotinoiden 
30 oder deren Vorstufen, insbesondere Bixin, Phytoen oder Xanthophylle, 
besonders bevorzugt Astaxanthin oder Zeaxanthin eignen sich besonders 
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10 



zur Hersteilung von Zusatzen fur Futter-, Nahrungs- und Nahrungsergan- 
zungsmittel, kosmetischen, pharmazeutischen oder dermatologischen Zu- 
bereitungen. 

Die Bereitstellung des von den gentechnisch verSnderten Zellen produ- 
zierten Carotinoids oder der von den gentechnischen verSnderten Zellen 
produzierten Carotlnoidvorstufe aus def Kultur der gentechnisch verSnder- 
ten Mikroorganismen erfolgt nach zwei Varianten a) oder b), becorzugt ist 
auch eine Kombination aus a) und b); 



a: 



I) Abtrennung der Biomasse, 

IA) ggf. Waschen der Biomasse mit einem Carotinoide 
nicht losenden Losungsmittel, insbesondere Wasser, 
15 IB) Sterilisation und ZellaufschluB der Biomasse, 

IC) ggf. Trocknung und/oder homogene Verteilung und 

II) partielle Extraktion der Carotinoide aus der aufgeschlosse- 
nen Biomasse mittels eines Carotinoide losenden Losungs- 
mittels und Trennung des Losungsmittels von der Biomasse, 

20 HA) 

1) Entfernung von Losemittelresten aus der Carotinoid- 
haltigen Biomasse, 

2) ggf. homogene Suspension der Biomasse mit einem 
Biomasse-Feststoffgehalt > 2 % und < 50 %, und 

25 3) Trocknung der Biomasse bzw. Suspension zur Her- 

steilung des Nahrungsmittels, 

MB) 

1) Kristallisation der Carotinoide aus dem verwendeten L6- 
sungsmittel und Isolierung der Carotinoid-Kristalle, insbe- 
30 sondere durch Filtration; 
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oder b): 



I) Homogene Suspendierung der Feststoffe der KulturbrQhe 
5 und 

1 1 A) bei einem Feststoffgehalt der KulturbrQhe von > 2 % 

1) ggf. Konzentration der KulturbrQhe auf einen Fest- 
stoffgehalt < 50 % und 
10 2) Trocknung der KulturbrQhe zur Herstellung des Nah- 

rungsmittels 

oder 



I IB) bei einem Feststoffgehalt von < 2 % der KulturbrQhe, 
15 1) Konzentration der KulturbrQhe auf einen Feststoffge- 

halt > 2 % und < 50 % und 
2) Trocknung der Suspension zur Herstellung des Nah- 
rungsmittels, 

oder 

20 

IIC) unabhangig vom Feststoffgehalt der KulturbrQhe, 

1) Abtrennung der Biomasse, 

2) ggf. Waschen der Biomasse mit Carotinoide nicht 16- 
senden Losungsmitteln, insbesondere Wasser, 

25 3) Sterilisation und ZellaufschiuR, 

4) ggf. Trocknung und homogene Verteilung, 

5) partielle Extraktion der Carotinoide aus der Biomasse 
mittels eines Carotinoide losendes Losungsmittels, 

5a) Abtrennung der Carotinoid-naltigen Biomasse vom 
30 Carotinoid-haltigen Losungsmittel, 
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5b) Entfemung von Losemittelresten aus der Biomasse 
und 

5c) Trocknung der Biomasse zur Herstellung des Nah- 
rungsmittels, 

5 6) Kristallisation der Carotinoide aus dem in 5a) verwen- 

deten Losungsmittel und Isolierung der Carotinoid- 
Kristalle, insbesondere durch Filtration. 

10 Die erfindungsgemalie Bereitstellung des von den gentechnisch verander- 
ten Zellen produzierten Carotinoids oder der von den gentechnischen ver- 
anderten Zellen produzierten Carotinoidvorstufe aus der Kultur der gen- 
technisch veranderten Mikroorganismen erfolgt nach zwei Varianten a) 
oder b) ermdglicht die gleichzeitige Herstellung von zwei Produkten. 

15 

Durch die erfindungsgemaBe Kombination der Herstellung von zwei Pro- 
dukten, insbesondere bei der Bereitstellung gemali Variante a), namlich 
dem mindestens einem Carotinoid und dem Carotinoid-haltigem Nah- 
rungsmittel ist keine vollstandige Extraktion der Carotinoide aus der Bio- 

20 masse ndtig, so dass der Aufwand bei der Extraktion geringer ausfallt. Das 
Carotinoid muss trotz vollstandiger Verwertung nur partiell extrahiert wer- 
den, ohne dass es zu Produktverlusten kommt. Dies bedingt geringere 
L6sungsmittelmengen und damit einhergehend einen geringeren Aufwand 
bei den Malinahmen zu deren Wiedervenwendung. Zudem werden Abfalle 

25 weitestgehend vermieden, da die Biomasse nicht als Abfall anfallt, son- 
dem zum hochwertigen Nahrungsmittel weiten/eraroeitet wird. Somit er- 
geben sich geringere Kosten fur die Verfahren durch Ausnutzen von Syn- 
ergien. 

30 Nach dem erfindungsgemallen Verfahren mit Bereitstellung gemali Vari- 
ante b) erhaltliche Nahrungsmittel enthalten also bereits nach der Herstel- 
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lung gro&e Mengen an Carotinoiden, die nicht zugesetzt werden mussen. 
Dadurch, dass das Nahrungsmittel neben dem mindestens einen Caroti- 
noid auch Blakeslea trispora enthalt ist sein Nahrstoffgehalt zudem gestei- 
gert. Insbesondere ist der Nahrstoffgehalt nach den bevorzugten Alternati- 

5 ven HA und IIB stark gesteigert, da es neben dem mindestens einen Caro- 
tinoid und Blakeslea trispora zusatzlich aile Medienbestandteile der Fer- 
mentation enthalt. Femer benotigt das Verfahren keine zusatzlichen, auf- 
wendigen Aufarbeitungs- und Herstellungsschritte, sondem die homogeni- 
sierte und ggf. entwasserte Blakeslea trispora-haltige Kulturbruhe kann 

10 direkt ohne Umwege zur Herstellung des Nahrungsmittels getrocknet wer- 
den. Es fallen demnach praktisch keine Abfalle an, abgesehen vom wass- 
rigem Medium bei der Alternative IIB, welches jedoch unproblematisch in 
einer Klaranlage gereinigt werden kann. Zusatzlich wird in alien drei Alter- 
nativen die gesamte Produktionsmenge Carotinoide ohne oder mit nur 

15 marginalen Veriusten verwertet, da gemafl IIA und IIB keine verlustreichen 
Trenn- bzw. Aufarbeitungsschritte vorgenommen werden mussen. Bei der 
Alternative IIIC wird ebenfalls die gesamte Produktionsmenge Carotinoide 
ohne oder mit nur marginalen Veriusten verwertet, da ein Teil in der Bio- 
masse zum Nahrungsmittel verarbeitet wird und der andere Teil zur Ge- 

20 winnung reiner Carotinoide extrahiert wird. Durch die erfindungsgemalle 
Kombination der Herstellung von zwei Produkten gemaii IIC, namlich dem 
Carotinoid-haltigem Nahrungsmittel und den Carotinoiden an sich, ist vor- 
teilhaft, dass wiederum im wesentlichen keine Abfalle entstehen und eine 
vollstandige Extraktion der Carotinoide aus der Biomasse unnotig ist, so 

25 dass sonst bei der Extraktion anfallende Aufwand geringer ausfallt. Das 
oder die wertvollen Carotinoide mussen trotz vollstandiger Verwertung nur 
partiell extrahiert werden, ohne dass es zu Produktverlusten kommt. Dies 
bedingt geringere Ldsungsmittelmengen und damit einhergehend einen 
geringeren Aufwand bei den MaSnahmen zu deren Wiederverwendung. 

30 Zudem werden Abfalle weitestgehend vermieden, da die Biomasse nicht 
als Abfall anfallt, sondem zum hochwertigen Nahrungsmittel verarbeitet 
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wird. Somit ergeben sich geringere Kosten fur die Verfahren durch Aus- 
nutzen von Synergien. 

Unter "hochrein" soil in der vorliegenden Anmeldung eine Reinheit des 
5 mindestens einen Carotinoids von mindestens 95%, bevorzugt > 95%, 
vorzugsweise > 96%, besonders bevorzugt > 97%, ganz besonders be- 
vorzugt > 98%, hdchst bevorzugt > 99% verstanden werden. 

Als nach dem erfindungsgema&en Verfahren herstellbare Carotinoide 
10 kommen alle natiiriichen und kunstlichen Carotine und Xanthophylle in 
Betracht. Insbesondere ist das mindestens eine Carotinoid aus der Grup- 
pe bestehend aus Astaxanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, 
Andonixanthin, Adonirubin, Canthaxanthin, 3-Hydroxyechinenon, 
3-Hydroxyechinenon, Lycopin, p-Carotin, Lutein, Phytofluen, Bixin und 
15 Phytoen ausgewShlt. Bevorzugterweise handelt es sich um Astaxanthin 
oder Zeaxanthin. Die Carotinoide k6nnen nach dem erfindungsgema&en 
Verfahren einzeln oder als Gemische von zwei oder mehrerer der zuvor 
genannten Carotinoide erhalten werden. Insbesondere bei Einsatz der 
weiter unten angegebenen gentechnisch veranderten Organismen (GVO) 
20 kann das oder kSnnen die Carotinoide gezielt hergestellt werden. 

Als Nahrungsmittel werden Zusammensetzungen angesehen, die der Er- 
nahrung dienen. Darunter fallen auch Zusammensetzungen fQr die Ergan- 
zung der Ernahrung. Insbesondere werden als Nahrungsmittel Tierfutter- 
25 mittel und Tierfuttererganzungsmittel angesehen. 

Nach der Kultivierung kann, gemaB Variante a) der Bereitstellung, die 
Biomasse von der Kulturbruhe abgetrennt. Hierzu k6nnen alle dem Fach- 
mann gelaufigen und Qblicherweise einsetzbaren Methoden zur 
30 festfflussig-Trennung eingesetzt werden. Hierunter fallen insbesondere die 
mechanischen Verfahren, wie Filtration und Zentrifugation, die auf der 
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Ausnutzung von Schwerkraft, Zentrifugalkraft, Druck oder Vakuum beru- 
hen. Zu den einsetzbaren Verfahren und Apparaten gehoren daneben 
u. a. Querstromfiltration bzw. Mebrantechniken wle Osmose, umgekehrte 
Osmose, Mikrofiltration, Ultrafiltration, Nanofiltration, Kuchenfiltrationsver- 

5 fahren (z.B. mittels Pressfilterautomaten, (Membran-, Rahmen- oder 
Kammer-)Fllterpressen, (RQhr-)drucknutschen, Saugnutschen, (Vakuum- 
)bandflltem, (Vakuum-)Trommelfiltem, Drehfiltern, Kerzenflltem), Zentrifu- 
gationsverfahren mittels kontinuierlich oder diskontinuierlich betriebener 
Zentrifugen oder Filterzentrifugen (z.B. Stulpfilterzentrifugen, Schalzentri- 

10 fugen, Schubzentrifugen, Siebschneckenzentrifugen, Gleitzentrifugen, Se- 
paratoren oder Dekantern), Verfahren unter Ausnutzung der Schwerkraft 
wie Flotation, Sedimentation, Sink-Schwimm-Aufbereitung und Klaren. 
Bevorzugterweise erfolgt die Abtrennung der Biomasse von der Kulturbru- 
he durch Zentrifugation mittels eines Dekanters oder durch Filtration, mit- 

15 tels einer Mebranfiltrationseinheit durchgefuhrt. 

In dem zweiten Schritt der Bereitstellung nach Variante b) wird eine ho- 
mogen yerteilte Suspension der Feststoffe in der Kulturbrilhe erzeugt. 
Hierzu konnen alle dem Fachmann gelaufigen und Qblicherweise einsetz- 
20 baren Methoden verwendet werden. Insbesondere kommen dazu Disper- 
giergerate, wie ein Ultra-Turrax® (im Labormaftstab) zum Einsatz. Ein 
Zellaufschluss ist nicht notwendig, kann aber vorgenommen werden. 

Falls notwendig, kann die Kulturbriihe entwassert werden, urn einen ge- 
25 eigneten Feststoffgehalt zwischen > 2 % und < 50 % zu erreichen. Hierzu 
konnen alle dem Fachmann gelaufigen und Qblicherweise einsetzbaren 
Methoden zur festfflussig-Trennung eingesetzt werden. Hierunter fallen 
insbesondere die mechanischen Verfahren, wie Filtration und Zentrifugati- 
on, die auf der Ausnutzung von Schwerkraft, Zentrifugalkraft, Druck oder 
30 Vakuum beruhen. Zu den einsetzbaren Verfahren und Apparaten gehoren 
daneben u. a. Querstromfiltration bzw. Mebrantechniken wie Osmose, 
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umgekehrte Osmose, Mikrofiltration, Ultrafiltration, Nanofiltration, Kuchen- 
filtrationsverfahren (z.B. mittels Pressfilterautomaten, (Membran-, Rah- 
men- Oder Kammer-)Fllterpressen, (ROhr-)drucknutschen, Saugnutschen, 
(Vakuum-)bandfiltern, (Vakuum-)Trommelfiltern, Drehfiltem, Kerzenflltern), 

5 Zentrifugationsverfahren mittels kontinuierlich oder diskontinuierlich be- 
triebener Zentrifugen oder Filterzentrrfugen (z.B. StOlpfilterzentrifugen, 
SchSlzentrifugen, Schubzentrifugen, Siebschneckenzentrifugen, Gleitzen- 
trifugen, Separatoren oder Dekantern), Verfahren unter Ausnutzung der 
Schwerkraft wie Flotation, Sedimentation, Sink-Schwimm-Aufbereitung 

10 und Klaren. Bevorzugterweise erfolgt die Abtrennung der Biomasse von 
der Kulturbriihe durch Zentrifugation mittels eines Dekanters oder wird 
durch Filtration, mittels einer Mebranfiltrationseinheit durchgefuhrt. An- 
schlieSend wird die Kulturbruhe getrocknet. Hierzu konnen wiederum alle 
dem Fachmann bekannten Verfahren und Apparate eingesetzt wer- 

15 den.lnsbesondere eignen sich Apparate zur thermischen Trocknung wie 
Konvektions-, Kontakt- und Strahlungstrocknung, z.B. Horden-, Kammer-, 
Kanal-, Flachbahn-, Teller-, Drehtrommel-, Rieselschacht-, Siebband-, 
Strom-, , Wirbelschicht-, FlieBbett-, Schaufel-, Kugelbett-, , Heizteller-, 
DQnnschicht-, Walzen-, Band-, Siebtrommel-, Schnecken-, Taumel-, Kon- 

20 takt-Scheiben-, Infrarot-, Mikrowellen- und Gefriertrockner, Spriihtrockner 
oder Spruhtrockner mit integrierter Wirbelschicht, die durch Dampf, Ol, 
Gas oder elektrischen Strom ggf . beheizt und ggf . unter Vakuum betrieben 
werden. Die Betriebsweie kann dabei je nach Apparat kontinuierlich oder 
diskontinuierlich sein. Daneben oder damit in Kombination konnen die 

25 oben bereits angegeben mechanischen Verfahren zur Festfflussig- 
Trennung verwendet werden. 

Eine Granulierung durch Extrusion wie dies aus der WO 97/36996 A2 her- 
vorgeht ist jedoch nicht notwendig. Durch die Trocknung wird das Nah- 
rungsmittel haltbar und lagerfahig. 

30 
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Insbesondere wird die KulturbrGhe spriihgetrocknet. Bevorzugt wird zur 
Trocknung die Spriihtrocknung eingesetzt, wie sie aus der DE 101 04 494 
A1, DE-A-12 11 911 Oder EP 0 410 236 A1 bekannt sind. Erganzend wird 
auf vgl. R6mpp Lexikon Chemie CD-ROM Version 2.0, Georg Thieme Ver- 
5 lag, 1999, "Spruhtrocknung" und R6mpp Lexikon Biotechnologie, Georg 
Thieme Verlag, 1992, "Zerstaubungstrocknung" verwiesen. Die SprOh- 
trocknung bietet den Vorteil der kurzen Verweilzeit des Produkts in der 
heilien Zone des Trockners, so dass eine besonders schonende Trock- 
nung erzielt wird. 

10 

Bei der SprOhtrocknung werden Eingangstemperaturen von ca. 115°C - 
180°C, bevorzugt 120°C -130°C, und Ausgangstemperaturen von ca. 
50°C - 80°C, bevorzugt 55°C - 70°C gewahlt. Als Trocknungsgas wird 
vorzugsweise Stickstoff eingesetzt. 

15 

Gegebenenfalls konnen zur Erzielung einer besseren Rieselfahigkeit Rie- 
selhilfsmittel, wie Kieselsauren etc. zugesetzt werden. Der Einsatz von 
inerten Tragermaterialien, d.h. niedermolekularen anorganischen Tragern 
wie NaCI, CaC03, Na2S04 oder MgS04, organischen Tragern wie Glu- 

20 cose, Fructose, Saccharose, Dextrine oder Starkeprodukten (Roggen-, 
Gersten-, Hafernnehl, WeizengrieBkleie) ist denkbar. 
Das getrocknete Produkt weist bevorzugt eine Restfeuchte von weniger 
als 10 %, bevorzugt weniger als 5 % bezogen auf die Trockenmasse auf. 
Sein Carotinoidgehalt liegt zwischen 0,05 und 20 %, insbesondere 1 und 

25 10 % bezogen auf die Trockenmasse. 

Das so hergestellte Nahrungsmittel kann entweder direkt verwendet wer- 
den oder mittels weiterer Zusatze aufbereitet werden, so wie dies eben- 
falls aus der DE 101 04 494 A1 bekannt ist. 
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Gemaft der Alternative IIC wird nach der Kultivlerung und vor der Trock- 
nung der Biomasse, die Biomasse von der Kulturbruhe zunachst abge- 
trennt. Hierzu konnen alle dem Fachmann gelaufigen und Qblicherweise 
einsetzbaren Methoden zur fest/fliissig-Trennung eingesetzt werden, wie 
5 sie bereits oben bei der Entwasserung genannt wurden. Bevorzugterweise 
erfolgt die Abtrennung der Biomasse von der Kulturbruhe durch Zentrifu- 
gation mittels eines Dekanters Oder durch Membranfiltration durchgefuhrt. 

Anschlieftend erfolgt optional das Waschen der Biomasse mit einem Caro- 
w tinoide nicht losenden Losungsmittel, insbesondere Wasser, wodurch ins- 
besondere Wasser losliche Komponenten entfernt werden. Dieser Schritt 
kann gegebenenfalls unter Verwendung weiterer Carotinoide nicht losen- 
den Ldsungsmittel (z. B. Alkohole) erganzt werden, was aber im Rahmen 
der Erfindung nicht notwendig ist und zur Vermeidung von AbfSllen nicht 
15 bevorzugt ist. 

Anschlieftend erfolgen die Sterilisation und der sich anschlieftende oder 
gleichzeitige Zellaufschluft der Zellen in der Biomasse. Durch die Sterilisa- 
tion werden die Mikroorganismen abgetdtet und gegebenenfalls vorhan- 
20 dene Enzymaktivitat beendet. Dies ist zur Verhinderung des Abbaus der 
Biomasse bzw. der darin enthaltenen Stoffe, insbesondere der Carotinoide 
und fur die Haltbarkeit von Bedeutung. 

Die Sterilisation kann mit einem ublichen, dem Fachmann gelaufigen Ver- 
25 fahren durchgefuhrt werden. Hierzu gehSren die Sterilisation mittels 
Dampf, insbesondere bei Temperaturen grafter 120 °C unter Druck (> 1 
bar) und Zeitdauern von > ca. 20 min. sowie die Behandlung mit energie- 
reichen Strahlen, wie UV-, Mikrowellen, Gamma- oder Beta-Strahlen. Be- 
vorzugterweise erfolgt die Sterilisation im Rahmen des erfindungsgema- 
30 Ben Verfahrens mittels Dampf oder Mikrowellenstrahlung. 
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Durch den nachfolgenden oder gleichzeitigen Zellaufschlufl, werden die 
innerhalb der Zellen vorliegenden Carotinoide freigesetzt. Der Zellauf- 
schlufc kann ebenfalls mit alien dem Fachmann bekannten Qblichen Ver- 
fahren erfolgen. Hierzu gehoren mechanische und nicht mechanische Me- 

5 thoden. Zu den mechanischen Methoden zahlen Trockenmahlen, Nafc- 
mahlen, RQhren, Homogenisieren (z.B. im Hochdruckhomogenisator) und 
die Verwendung von Ultraschall oder Mikrowellen. Als nicht mechanische 
Methoden kommen physikalische, chemische und biochemische Metho- 
den in Betracht. Hierzu gehoren Kurzzeiterhitzen, Kurzzeitgefrieren, Os- 

10 motischer Schock, Trocknung, Behandlung mit Sauren oder Laugen sowie 
ein enzymatischer Aufschluss. Gunstiger Weise wird zum Zellaufschluss 
jedoch das zur Sterilisation verwendete Verfahren eingesetzt. Bevorzug- 
terweise wird also ebenfalls der Zellaufschluss mittels Dampf oder Mikro- 
wellen Strahlung durchgefQhrt. 

15 

Die Sterilisation und/oder der Zellaufschluss konnen kontinuierlich oder 
diskontinuierlich durchgefQhrt werden. 

Die Sterilisation und/oder der Zellaufschluss konnen im zur Kultivierung 
20 eingesetzten Bioreaktor oder in anderen Apparaturen, wie Autoklaven 
usw. durchgefQhrt werden. Bei kontinuierlicher DurchfOhrung kann das aus 
der WO 01/83437 A1 bekannte Mikrowellen verwendende Verfahren und 
entsprechende Apparaturen eingesetzt werden. 

25 Vor der Extraktion wird die Biomasse gegebenenfalls getrocknet und/oder 
homogenisiert. Hierzu konnen wiederum alle dem Fachmann bekannten 
Qblichen Verfahren und Gerate eingesetzt werden. Insbesondere eignen 
sich Apparate zur thermischen Trocknung wie Konvektions-, Kontakt- und 
Strahlungstrocknung, z.B. Horden-, Kammer-, Kanal-, Flachbahn-, Teller-, 

30 Drehtrommel-, Rieselschacht-, Siebband-, Strom-, , Wirbelschicht-, Flieli- 
bett-, Schaufel-, Kugelbett-, , Heizteller-, DQnnschicht-, Walzen-, Band-, 
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Siebtrommel-, Schnecken-, Taumel-, Kontakt-Scheiben-, Infrarot-, Mikro- 
wellen- und Gefriertrockner, Spriihtrockner oder Spriihtrockner mit inte- 
grierter Wirbelschicht, die durch Dampf, 01, Gas oder elektrischen Strom 
ggf. beheizt und ggf. uriter Vakuum betrieben werden. Die Betriebsweise 
5 kann dabei je nach Apparat kontinuieriich oder diskontinuierlich sein. 
Daneben oder damit in Kombination konnen die oben bereits angegeben 
mechanischen Verfahren zur Fest/fKissig-Trennung verwendet werden. 

Eine Granulierung durch Extrusion wie dies aus der WO 97/36996 A2 her- 
10 vorgeht ist jedoch nicht notwendig. 

Anschlieftend erfolgt die partielle Extraktion der Carotinoide aus der auf- 
geschlossenen Biomasse mittels eines Carotinoide ISsenden LSsungsmit- 
tels und Trennung des Losungsmittels von der Biomasse. Sowohl in dem 
15 Losungsmittel ais auch in der Biomasse sind nun Carotinoide enthalten, 
wobei sich in dem Losungsmittel bevorzugterweise der Groliteil der Caro- 
tinoide befindet. 

Aus dem Losungsmittel werden anschlieBend die hochreinen Carotinoide 
20 isoliert, wohingegen die Biomasse zu einem hochwertigen, Carotinoid- 
haltigen Nahrungsmittel weiterverarbeitet wird, welches durch den vorher- 
gehenden Zellaufschluss auch eine gute BioverfOgbarkeit der Carotinoide 
aufweist. 

25 Unter partieller Extraktion soil demnach die bewusst unvollstandige 
Extraktion der Carotinoiden aus der Biomasse verstanden werden (vgl. 
oben). Bevorzugterweise wird im Rahmen der Erfindung durch die Extrak- 
tion also weniger als 100 % der in der Biomasse enthaltenen Gesamt- 
menge der Carotinoide aus dieser extrahiert. 

30 Dies ist von groliem Vorteil, da der Aufwand zur Extraktion mit der ab- 
nehmenden Menge Carotinoid in der Biomasse Oberproportional zunimmt. 
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Zur Extraktion werden LOsungsmittel eingesetzt, die Carotinoide Idsen, wie 
z. B. Hexan, Ethylacetat, Dichlormethan oder Qberkritisches Kohlendioxid. 
Bevorzugterweise wird erfmdungsgemall ais Losungsmittel Dichlormethan 

5 oder Qberkritisches Kohlendioxid eingesetzt, wobei beim Einsatz von 
uberkritischem Kohlendioxid die darin enthaltenen Carotinoide anschlie- 
ftend in Dichlormethan QberfQhrt werden konnen oder das Wertprodukt 
direkt durch Entspannung des Kohlendioxids gewonnen werden kann. 
Dabei werden die Mengen der L6sungsmittel und Durchmischungszeiten 

10 derart gewahlt, dass die gewQnschte Menge Carotinoide aus der Bio- 
. masse extrahiert wird. Insbesondere wird der Extraktionsschritt nur einmal 
durchgefuhrt, was technisch und wirtschaftlich sinnvoll ist (vgl. oben). 

Zur DurchfQhrung der Extraktion konnen alle Qblichen Verfahren und Ap- 
15 paraturen eingesetzt werden. Insbesondere wird bei nicht getrockneter, 
aber aufgeschlossener Biomasse eine flussig/flussig (Carotinoid liegt in 
flQsstgen Zellbestandteilen gelost vor und wird daraus extrahiert und bei 
getrockneter Biomasse eine festfflussig Extraktion durchgefuhrt. Es k6n- 
nen Kalt- und HeiBextraktion in bestimmten Temperaturbereichen, sowohl 
20 kontinuierliche (z.B. Soxhlet-Extraktion, Perforation und Perkolation) als 
auch diskontinuierliche Verfahren, zu denen beispielsweise Ausschutteln, 
Auslaugen, Auskochen und Digerieren gehSren, verwendet werden. Sie 
konnen auch im Gegenstromverfahren durchgefuhrt werden. 

25 Fur die flussig/flussig Extraktion konnen beispielsweise Blasensaulen, , 
pulsierende Kolonnen, Kolonnen mit rotierenden Einbauten, Mixer-SetrJer- 
Batterien oder RQhrkessel usw. verwendet werden. 

Die fest/flQssig Extraktion kann mittels Qblicher Apparaturen durchgefuhrt 
30 werden. Vorzugsweise werden RQhrkessel oder Mixer-Settler-Apparate 
eingesetzt. 
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Alternativ kann der ZellaufschluU ohne vorherige Abtrennung des Fermen- 
taionsmediums erfolgen und sich dann eine direkte Trennung einer sich 
bildenden Carotinoidsuspension von der Biomasse z. B. mittels eines De- 
5 kanters durchgefiihrt werden. AnschlieRend wird die Carotinoidsuspension 
in Dichlormethan aufgenommen und weiterverarbeitet Oder alternativ 
durch Waschen mit verschiedenen wassrigen Losungen aufgereinigt. 

Zur Isolierung der hochreinen Carotinoide aus dem Losungsmittel wird 
10 eine Kristallisation der Carotinoide aus dem verwendeten Losungsmittel 
und Isolierung der Carotinoid-Kristalle, insbesondere durch Filtration 
durchgefuhrt. Die verbleibende Mutterlauge kann nach Destination dem 
Verfahren emeut zugefuhrt werden, so dass Produktverluste trotz gerin- 
gem Aufwand minimiert werden. 

15 

Die Kristallisation kann wie ublich erfolgen. Erganzend wird auf vgl. 
RSmpp Lexikon Chemie CD-ROM Version 2.0, Georg Thieme Verlag, 
1999, "Kristallisation" verwiesen. 

20 Bevorzugterweise erfolgt die Kristallisation durch graduellen Losungsmit- 
telaustausch gegen ein Carotinoide nicht losendes Losungsmittel. Es wird 
also kontinuierlich die Leslichkeit der Carotinoide erniedrigt, bis diese als 
reine Kristalle ausfallen. Hierbei wird vorzugsweise ein "niederer Alkohol" 
oder Wasser verwendet. Als niederer Alkohol werden aliphatische Alkoho- 

25 le mit 1 bis 4 Kohlenstoffatomen angesehen. Hierzu gehQren Methanol, 
Ethanol, Propanol, Isopropanol, 1-Butanol, tert.-Butanol und sec.-Butanol. 
Bevorzugterweise wird Methanol eingesetzt. 

Die Carotinoid-Losung kann dabei erwarmt werden, wobei die Temperatur 
30 vorzugsweise < 100 °C, insbesondere < 60 °C gehalten wird, so dass 
Dichlormethan abdestilliert wird. Auch der Einsatz von Vakuum ist denk- 
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bar. Anschliefcend werden die CarotinoidKristalle isoliert, welches durch 
ubliche Malinahmen, insbesondere durch Filtration erfolgen kann. Es kon- 
nen sich, falls gewQnscht, weitere optionale Trocknungs- und/oder Reini- 
gungsschritte anschlie&en. Notwendig sind diese jedoch nicht, da die Ca- 
5 rotinoid Kristalle bereits hochrein sind. 

Die Carotinoide fallen als hochreine Kristalle an und weisen eine Reinheit 
von mindestens 95%, bevorzugt > 95%, vorzugsweise > 96%, besonders 
bevorzugt > 97%, ganz besonders bevorzugt > 98%, hSchst bevorzugt > 
10 99% auf. 

Die erzielbaren Ausbeuten liegen zwischen 45% und 95%, bevorzugt zwi- 
schen 70% und 95% bezogen auf die in der Kulturbrtihe vorliegende Men- 
ge (0,5 - 15 g/L, bevorzugt 1-10 g/L). 

15 

Zur Weiterverarbeitung der ebenfalls Carotinoid-haltigen Biomasse zu ei- 
nem hochwertigen Nahrungsmittel wird zunachst eine Entfemung von L6- 
semittelresten aus der Carotinoid-haltigen Biomasse vorgenommen. Hier- 
zu erfolgt bevorzugterweise eine Wasserdampfdestillationen bzw. ein so 
20 genanntes Strippen mit Wasserdampf (vgl. RSmpp Lexikon Chemie CD- 
ROM Version 2.0, Georg Thieme Verlag, 1999, "Strippen"). 

Danach kann gegebenenfalls die Biomasse in der oben abgetrennten Kul- 
turbrtihe homogen suspendiert werden, wobei ein Feststoffgehalt > 100 

25 g/L und < 600 g/L eingehalten werden sollte, so dali die nachfolgende 
Trocknung der Biomasse bzw. Suspension zur Herstellung des Nah- 
rungsmittels ohne technische Schwierigkeiten erfolgen kann. D.h. die Sus- 
pension muli pumpbar sein. Als Trocknungsverfahren kommen alle bereits 
genannten Verfahren und Apparaturen in Frage. Insbesondere wird zur 

30 Trocknung die SprUhtrocknung eingesetzt. Dabei .kann wie aus der DE 
101 04 494 A1 bekannt verfahren werden. 
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Bei der Spriihtrocknung werden Eingangstemperaturen von ca. 100°C - 
180°C, bevorzugt 120°C -130°C, und Ausgangsternperaturen von ca. 50 - 
80°C, bevorzugt 55°C - 70°C gewahlt. Als Trocknungsgas wird vorzugs- 
5 weise Stickstoff eingesetzt. 

Das so hergestellte Nahrungsmittel kann entweder direkt verwendet wer- 
den oder mittels weiterer Zusatze aufbereitet werden, so wie dies eben- 
falls aus der DE 101 04 494 A1 bekannt ist. 

10 

Als Nahrungsmittel werden Zusammensetzungen angesehen, die der Er- 
nahrung dienen. Darunter fallen auch Zusammensetzungen fur die Ergan- 
zung der ErnShrung. Insbesondere werden als Nahrungsmittel Tierfutter- 
mittel und TierfutterergSnzungsmlttel angesehen. Erganzend wird auf 
15 R6mpp Lexikon Chemie CD-ROM Version 2.0, Georg Thieme Verlag, 
1999, "Nahrungsmittel" verwiesen. 

Das trockene Produkt weist bevorzugt eine Restfeuchte von weniger als 5 
% bezogen auf die Trockenmasse auf. Sein Carotinoidgehalt liegt zwi- 
20 schen 0,05 und 20 %, insbesondere 1 und 10 % bezogen auf die Trok- 
kenmasse. Der gewGnschte Carotinoidgehalt ist fiber das Ausmaft der 
Extraktion steuerbar (vgl. oben). 

Nach dem erfindungsgemalien Verfahren erhaltliche Nahrungsmittel ent- 
25 halten also bereits nach der Herstellung grolie Mengen an Carotinoiden, 
die nicht zugesetzt werden mtissen. Dadurch, dass das Nahrungsmittel 
neben dem mindestens einen Carotinoid auch Biomasse enthalt ist sein 
Nahrstoffgehalt zudem gesteigert Insbesondere ist der NShrstoffgehalt 
nach der bevorzugten Alternative stark gesteigert, im dem es neben dem 
30 mindestens einen Carotinoid und Biomasse zusatzlich alle Medienbe- 
standteile der Fermentation enthalt. Es fallen demnach praktisch kelne 
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Abfalle an, abgesehen von wassrigen Medien, welche jedoch unproblema- 
tisch in einer Klaranlage gereinigt werden konnen. Zusatzlich wird die ge- 
samte Produktionsmenge Carotinoide ohne Oder mit nur marginalen Ver- 
lusten verwertet, da keine verlustreichen Trenn- bzw. Aufarbeitungsschrit- 
5 te vorgenommen werden miissen, um die gesamte Menge Carotinoid zu 
extrahieren. 

Die in dem oben beschriebenen, erfindungsgema&en Verfahren einge- 
setzten LSsungsmittel werden alle soweit wie moglich aufbereitet und an- 

10 schlieBend wieder verwendet bzw. dem Verfahren erneut zugefQhrt. Ins- 
besondere wird das eingesetzte Dichlormethan bereits beim Losungmitte- 
laustausch gereinigt und stent anschlieRend zur erneuten Verwendung 
bereit. Der niedere Alkohol bzw. das Methanol wird z. B. destillativ gerei- 
nigt und ebenfalls wieder verwendet. A!s Abfall fallen lediglich der Destilla- 

15 tionssumpf an, der zusammen mit den wassrigen Medien gefahrlos einer 
Klaranlage zugefQhrt werden kann. wo letztendlich nur eine geringe Men- 
ge Klarschlamm als tatsachlicher Abfall anfallt. Somit ist das beschriebene 
Verfahren im wesentlichen abfallfrei. 

20 

Die Erfindung wird nachfolgend an Hand von Beispielen n§her ausgefQhrt. 



25 Al Kultjyjerung von Bla keslea trispora 

Folgende Medien wurden zur Fermentation von Blakeslea trispora zur 
Produktion der Carotinoide eingesetzt: 
Medium 1: 

Glucose 10,00 g/l 

30 Baumwollsaatoel 30,00 g/l 

Sojaoel 30,00 g/l 
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Dextrin 60,00 g/l 

Baumwollsamenmehl 75,00 g/l 

Triton X 100 1,20 g/l 

Ascorbinsaure 6,00 g/l 

5 Milchsaure 2,00 g/l 

KH 2 P0 4 0,50 g/l 

MnS0 4 xH20 100mg/l 

Thiamin-HCI 2 mg/l 

Isoniazid (Isonicotinsaurehydrazid) 0,75 g/l 

10 Der pH wurde auf 6,5 eingestellt. 



Medium 2: 

20 g/l 
2,00 g/l 
5,00 g/l 
0,50 g/l 
28 mg/l 
1,00 mg/l 
2,00 mg/l 
1,50 mg/l 
1,00 mg/l 
0,30 mg/l 
0,05 mg/l 
0,05 mg/l 

25 



Glucose 
Asparagin 

15 KH2PO4 

MgS0 4 x 7 H 2 0 
CaCfe 

Thiamin-HCI 
Citronensaure 
20 Fe(N0 3 )3 x 9 H 2 0 
ZnSC-4 x 7 H 2 0 
MnS0 4 x H 2 0 
CuS0 4 x 5 H2O 
Na 2 Mo0 4 x 2 H 2 0 



Medium 3 
Glucose 
30 Asparagin 
Hefe Extrakt 



70,00 g/l 
2,00 g/l 
1.00 g/l 
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60 

KH2PO4 1,50 g/l 

MgS0 4 x 7 H 2 0 0,50 g/l 

Span 20 1,00 g/l 

Thiamin-HCI 5,0 mg/l 



5 Der pH wurde auf 5,5 eingestellt. 

Mlt Sporensuspensionen von Blakeslea trispora ATCC 14272 Mating Type 
(-) die 10 8 (fQr Medium 2) bzw. 10 7 (fOr Medium 1 und 3) Sporen enthiel- 
ten, wurden je 200 ml der beschriebenen Medien angeimpft. Die Kultivie- 
10 rung erfolgte jeweils in 1-l-Erienmeyerkolben mit Schikanen. Mit jedem 
Medium wurden sechs identische Kolben angesetzt und Dber 7 Tage bei 
28°C und 140 UpM im Schuttler inkubiert. 

B) Gentechnlsche Veranderuna von Blakeslea Trispora 

15 

Material und Methoden 

Molekulargenetische Arbeiten wurden, wenn nicht anders beschrieben, 
nach den Methoden in Current Protocols in Molecular Biology (Ausubel et 
al., 1999, John Wiley & Sons) durchgefuhrt. 

20 

Stamme und Wachstumsbedingungen 

Die Blakeslea trispora Stamme ATCC 14271 (Paarungstyp(+)) und 
ATCC14272 (-) (ein Wildtyp) wurde erhaltenPaarungstyp (-)) wurden von 
der American Type Culture Collection, erhalten. Die Anzucht von B. trispo- 
25 ra erfolgte in MEP-Medium (Malzextrakt-Pepton-Medium): 30 g/l Malzex- 
trakt (Difco), 3 g/l Pepton (Soytone, Difco), 20 g/l Agar, Einstellung pH 5,5, 
ad 1000 ml mit H 2 0 bei 28 °C. 

Die Anzucht von Agrobacterium tumefaciens LBA4404 erfolgte nach Hoe- 
30 kema et al. (1983, Nature 303:179-180) bei 28 °C fur 24 h in Agrobacteri- 
en-Minimal Medium (AMM): 10 mM K 2 HP0 4 . 10 mM KH 2 P0 4 , 10 mM Glu- 
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cose, MM-Salze (2,5 mM NaCI, 2 mM MgS0 4 , 700 pM CaCI 2 , 9 pM Fe- 
S0 4 , 4 mM (NH 4 ) 2 S0 4 ). 

Transformation von Agrobacterium tumefaciens 

5 Das Plasmid pBinAHyg wurde in den Agrobakterienstamm LBA 4404 
(Hoekema et al., 1983, Nature 303:179-180) elektroporiert (Mozo and Ho- 
oykaas, 1991, Plant Mol. Biol. 16:917-918). Zur Selektion wurden bei der 
Agrobakterienanzucht folgende Antibiotika verwendet: Rifampicin 50 mg/l 
(Selektion auf das A. tumefaciens Chromosom), Streptomycin 30 mg/l (Se- 

10 lektion auf das Helferplasmid) und Kanamycin 100 mg/l (Selektion auf den 
binaren Vektor). 

Transformation von Biakeslea trispora 

Zur Transformation wurden die Agrobakterien nach 24 h Anzucht in AMM 
15 auf eine OD 6 oo von 0,15 in Induktionsmedium (IM: MM-Salze, 40 mM MES 
(pH 5,6), 5 mM Glucose, 2 mM Phosphat, 0,5% Glycerol, 200 pM Acetosy- 
ringone) verdQnnt und emeut Qber Nacht in IM bis zu einer OD 6 oo von ca. 
0,6 angezogen. 

20 Zur Co-lnkubation von Biakeslea ATCC 14271 bzw. ATCC14272 und 
Agrobacterium wurden 100 pi Agrobakteriensuspension mit 100 pi Biakes- 
lea Sporensuspension (10 7 Sporen/ml in 0,9% NaCI) gemischt und steril 
auf einer Nylon Membran (Hybond N, Amersham) auf IM-Agarose Platten 
(IM + 18 g/l Agar) verteilt. Nach 3 Tagen Inkubation bei 26 °C wurde die 

25 Membran auf eine MEP-Agarplatte (30 g/l Malzextrakt, 3 g/l Pepton, pH 
5,5, 18 g/l Agar) Oberfuhrt. Zur Selektion auf transformierte Blakesleazel- 
len enthielt das Medium Hygromycin in einer Konzentration von 100 mg/l 
sowie zur Selektion gegen Agrobakterien 100 mg/l Cefotaxim. Die Inkuba- 
tion erfolgte fur ca. 7 Tage bei 26 °C. AnschlielSend erfolgte der Transfer 

30 von Mycel auf frische Selektionsplatten. Gebildete Sporen wurden mit 
0,9% NaCI abgespOlt und auf CM17-1-Agar (3 g/l Glucose, 200 mg/l L- 
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Asparagin, 50 mg/l MgS0 4 x 7H 2 0, 150 mg/l KH 2 P0 4 , 25 ug/l ThiaminHCI, 
100 mg/l Yeast Extract, 100 mg/l Na-desoxycholat, 100 mg/L Hygromycin, 
100 mg/L Cefotaxim, pH 5,5,18 g/l Agar) ausplattiert. Zur Isolierung ein- 
zelner gentechnisch veranderter Sporen wurden die Sporen durch ein 
5 FACS Gerat der Fa. BectonDickson (Modell Vantage+Diva Option) einzeln 
. auf Selektivmedium. abgelegt. 

Mutagenese mit MNNG 

Zur Reduzierung der Anzahl von Kemen pro Spore wurde eine Behand- 
10 lung von Sporensuspensionen mit MNNG (N-Methyl-N'-nitro-N- 
nitrosoguanidin) durchgefuhrt. Hierfur wurde zunachst eine Sporensus- 
pension mit 1 x 10 7 Sporen/ml in Tris/HCI-Puffer, pH 7,0 hergestellt. Der 
Sporensuspension wurde MNNG in einer Endkonzentration von 100 ug/ml 
zugegeben. Die Zeit der Inkubation in MNNG wurde so gewahlt, dass die 
15 Oberlebensrate der Sporen ca. 5% betrug. Nach Inkubation mit MNNG 
wurden die Sporen dreimal mit 1g/l Span 20 in 50 mM Phosphatpuffer pH 
7,0 gewaschen und plattiert. 

Selektion homonukleater Zellen 

20 Die Selektion homonukleater Zellen von Blakeslea trispora carB" erfolgte 
analog zum Versuchsprotokoll fOr Phycomyces blakesleeanus (Roncero et 
al., 1984, Mutation Research, 125:195-204), modifiziert durch Wachstum 
in Gegenwart von 5-Carbon-5-Deazariboflavin (1 ug/ml) und Hygromycin 
100 (ug/ml). 

25 

Herstellung genetisch veranderter Blakeslea trispora durch Agrobac- 
terium-vermittelte Transformation 
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Herstellung des rekombinanten Plasmids pBinAHyg 

Aus dem Plasmid pANsCosI (Fig.1, Osiewacz, 1994, Curr. Genet. 26:87- 
90, SEQ ID NO: 4) wurde die gpdA-hph-trpC-Kassette als Bglll/HindlM 
Fragment isoliert und in das mit BamHI/Hindlll geaffnete binare Plasmid 

5 pBin19 (Bevan, 1984, Nucleic Acids Res. 12:8711-8721) ligiert. Der so 
erhaltene Vektor wurde als pBinAHyg bezeichnet (Fig. 2, SEQ ID NO: 3) 
und enthielt das £. coli Hygromycin-Resistenzgen (hph) unter Kontrolle 
des gpd Promotors (SEQ ID NO: 1) und des trpC Terminators (SEQ ID 
NO: 2) aus Aspergillus nidulans sowie die entsprechenden Borderse- 

10 quenzen, die fur den DNA-Transfer von Agrobacterium notwendig sind. 
Die in den weiter unten beschriebenen Ausfuhrungsbeispielen genannten 
Vektoren sind AbkSmmlinge von pBinAHyg. 

Obertragung von pBinAHyg und Abkdmmlingen von pBinAHyg in 
15 Agrobacterium tumefaciens 

Nachfolgend wird beispielhaft die Obertragung des Plasmids pBinAHyg in 
Agrobacterien beschrieben. Die Obertragung der AbkOmmlinge erfolgte 
analog. 

20 Das Plasmid pBinAHyg wurde in den Agrobakterienstamm LBA 4404 
(Hoekema et al., 1983, Nature 303:179-180) elektroporiert (Mozo and Ho- 
oykaas, 1991, Plant Mol. Biol. 16:917-918). Zur Selektion wurden bei der 
Agrobakterienanzucht folgende Antibiotika verwendet: Rifampicin 50 mg/l 
(Selektion auf das A. tumefaciens Chromosom), Streptomycin 30 mg/l (Se- 

25 lektion auf das Helferplasmid) und Kanamycin 100 mg/l (Selektion auf den 
binaren Vektor). 

Obertragung von pBinAHyg und Abkdmmlingen von pBinAHyg in 
Blakeslea trispora 

30 Zur Transformation wurden die Agrobakterien nach 24 h Anzucht in AMM 
auf eine OD 6 6o von 0,15 in Induktlonsmedium (IM: MM-Salze, 40 mM MES 
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(pH 5,6), 5 mM Glucose, 2 mM Phosphat, 0,5% Glycerol, 200 uM Acetosy- 
ringone) verdOnnt und erneut Ober Nacht In IM bis zu einer ODeeo von ca. 
0,6 angezogen. 

5 Zur Co-lnkubation von Blakeslea trispora (B.t.) und Agrobacterium tume- 
faciens (A.t.) wurden 100 ul Agrobakteriensuspension mlt 100 ul Blakeslea 
Sporensuspension (10 7 Sporen/ml in 0,9% NaCI) gemischt und steril auf 
einer Nylon Membran (Hybond N, Amersham) auf IM-Agarose Platten (IM 
+ 18 g/l Agar) verteilt. Nach 3 Tagen Inkubation bei 26 °C wurde die Mem- 

10 bran auf eine MEP-Agarplatte (30 g/l Malzextrakt, 3 g/l Pepton, pH 5,5, 18 
g/l Agar) Qberfuhrt. 

Zur Selektion auf transformierte Blakeslea-Zellen enthielt das Medium Hy- 
gromycin in einer Konzentration von 100 mg/l sowie zur Selektion gegen 

15 Agrobakterien 100 mg/l Cefotaxim. Die Inkubation erfolgte fur ca. 7 Tage 
bei 26 °C. Anschliellend erfolgte der Transfer von Mycel auf frische Selek- 
tionsplatten. Gebildete Sporen wurden mit 0,9% NaCI abgespQIt und auf 
CM1 7-1 -Agar (3 g/l Glucose, 200 mg/l L-Asparagin, 50 mg/l MgS0 4 x 
7H 2 0, 150 mg/l KH2P04, 25 ug/l Thiamin-HCI, 100 mg/l Yeast Extract, 

20 100 mg/l Na-desoxycholat, pH 5,5, 100 mg/l Cefotaxim, 100 mg/l Hygro- 
mycin, 18 g/l Agar) ausplattiert. Die Obertragung von Sporen auf frische 
Selektionsplatten wurde dreimal wiederholt. Auf diese Weise wurde die 
Transformante Blakeslea trispora GVO 3005 isoliert. Altemativ erfolgte zur 
Selektion der GVO (gentechnisch veranderten Organismen) die Einzelab- 

25 lage der Sporen durch den BectonDickinson FacsVantage+Diva Option 
auf CM-17 Agar mit 100 mg/l Cefotaxim, 100 mg/l Hygromycin. In diesem 
Fall wurde nur dort Pilzmycel gebildet, wo die Sporen gentechnisch veran- 
dert waren. 



30 Nachweis der genetischen Veranderung durch Obertragung von pBi- 
nAHyg und Abkdmmlingen von pBinAHyg in Blakeslea trispora 
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Nachfolgend wird beispielhaft der Nachweis der Obertragung fiir pBinA- 
Hyg in Blakeslea trispora beschrieben. Der Nachweis der Obertragung der 
Abkdmmlinge erfolgte analog. 

5 200 ml MEP-Medium (30 g/l Malzextrakt, 3 g/1 Pepton, pH 5,5) wurden mit 
10 5 bis 10 7 Sporen der Transformante Blakeslea trispora GVO 3005 be- 
impft und 7 Tage bei 26 °C mit 200 Upm auf einem RundschQttler inku- 
biert. Zum Nachweis der erfolgreichen Transformation wurde DNA aus 
dem Mycel isoliert (Peqlab Fungal DNA Mini Kit) und in einer PCR (Pro- 

10 gramm: 94 °C 1 min, dann 30 Zyklen mit 1 min. 94°C, 1 min. 58 °C, 1 min. 
72 °C) eingesetzt. 

Zum Nachweis des Hygromycinresistenzgens (hph) wurden die Primer 
hph-forward (5-CGATGTAGGAGGGCGTGGATA, SEQ ID NO: 5) und 
15 hph-reverse (5'-GCTTCTGCGGGCGATTTGTGT, SEQ ID NO: 6) verwen- 
det. Das erwartete Fragment von hph wies eine Lange von 800 bp auf. 

Zur Amplifikation des Kanamycinresistenzgens nptlll und damit als Kon- 
trolle auf Agrobakterien wurden die Primer nptlll-forward (5'- 
20 TGAG AATATCACCGGAATTG , SEQ ID NO: 7) und nptlll-reverse (5'- 
AGCTCGACATACTGTTCTTCC, SEQ ID NO: 8) verwendet. Das erwarte- 
te Fragment von nptlll wies eine Lange von 700 bp auf. 

Zur Amplifikation eines Fragmentes des Glycerinaldehyd-3- 
25 phosphatdehydrogenasegens gpdt und damit als Kontrolle auf Blakeslea 
trispora wurden die Primer MAT292 (5- 

GTGAATGGAAATCCCATCGCTGTC, SEQ ID NO: 9) und MAT293 (5'- 
AGTGGGTACTCTAAAGGCCATACC, SEQ ID NO: 10) verwendet. Das 
erwartete Fragment von gpdl wies eine Lange von 500 bp auf. 
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Das Ergebnis der PCR der Blakeslea trispora DNA ist in Fig. 3 anhand 
eines Standard-Gels gezeigt. Die Spuren des Gels wurden folgenderma- 
ften belegt: 

5 1) 100 bp GrSftenmarker (100 bp - 1 kb) 

2) B.t. GVO 3005 primer nptlll-for / nptlll-rev 

3) B.t. GVO 3005 primer hph-for / hph-rev 

4) B.t. GVO 3005 primer MAT292 / MAT293 (gpd) 

5) A.t. mit Plasmid pBinAHyg primer nptlll-for / nptlll-rev 
10 6) A.t. mit Plasmid pBinAHyg primer hph-for / hph-rev 

7) B.t. 14272 WT primer nptlll-for / nptlll-rev 

8) B.t. 14272 WT primer hph-for / hph-rev 

9) B.t. 14272 WT primer MAT292 / MAT293 (gpd) 

15 In der DNA von Blakeslea trispora wurde das Hygromycinresistenzgens 
(hph) und als Positivkontrolle Glycerinaldehyd-3- 
phosphatdehydrogenasegen (gpdl) nachgewiesen. nptlll konnte dem- 
gegenOber nicht nachgewiesen werden. 

20 Somit wurde die genetische Veranderung von Blakeslea trispora durch 
Agrobacterium-vermittelte Transformation nachgewiesen. 



Isolierung homokaryotischer GVO von Blakeslea trispora: 



25 Herstellung homonukleater Stamme 

Durch erfolgreichen Transfer des Vectors pBinAHyg und AbkSmmlingen 
von pBinAHyg in Blakeslea trispora entstandenentstehen genetisch ver- 
anderte Organismen. In GVO von Blakeslea trispora. Jedoch liegen in 
Blakeslea liegen in alien Stadien des vegetativen und des sexuellen Zell- 
30 zyklus mehrkernige Zellen vor. Daher erfolgte erfolgt die Insertion der Vec- 
torFremd-DNA in der Regel nur in einem Kern. Ziel ist es aber, dass, 
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Stamme von Blakeslea zu erhalten, bei denen die Insertion der Vectdr- 
Fremd-DNA in alien Kernen vorliegt., d.h. Ziel ist ein homonukleates re- 
kombinantes Pilzmycel. 

5 Zur Herstellung solcher homokaryotischer Zellen wurden zunachst Spo- 
rensuspensionen der rekombinanten Stamme mit MNNG behandelt. Hier- 
ftir wurde eine Sporensuspension mit 1 x 10 7 Sporen/ml in Tris/HCI-Puffer, 
pH 7,0 hergestellt. Der Sporensuspension wurde MNNG in einer Endkon- 
zentration von 100 ug/ml zugegeben. Die Dauer der Inkubation mit MNNG 

10 wurde so gewShlt, dass die Qberlebensrate der Sporen ~5% betrug. Nach 
Inkubation mit MNNG wurden die Sporen dreimal mit 1g/l Span 20 in 50 
mM Phosphatpuffer pH 7,0 gewaschen und plattiert. 

1) Herstellung homonukleater rekombinanter Stamme durch FACS 
15 (fluorescence-activated cell sorting) 

Ein geringer Anteil der Sporen von Blakeslea trispora bzw. der gentech- 
nisch veranderten Stamme von Blakeslea trispora ist von Natur aus ein- 
kemig. Zur Herstellung homonukleater rekombinanter Stamme, die Fremd- 
DNA von pBinAHyg Oder pBinAHyg-Abkdmmlingen enthielten, wurden die 

20 einkernigen Sporen durch FACS aussortiert und auf MEP (30 g/l Malzex- 
trakt, 3 g/l Pepton, pH 5,5, 18 g/l Agar) mit 100 mg/l Cefotaxim und 100 
mg/l Hygromycin plattiert. Die hier gebildten Mycelien waren homonukleat. 
Zur Sortierung mit FACS wurden die Sporen eines 3 Tage alten Ausstri- 
ches mit 10 ml Tris-HCI 50mMol + 0,1% Span20 pro Agar-Platte abge- 

25 schwemmt. Die Sporenkonzentration betrug 0,5 bis 0,8 x 10 7 Sporen pro 
ml. Zu 9 ml Sporensuspension wurden 1ml DMSO und 10 pi Syto 11 
(Farbstoff-Stammlosung in DMSO Molecular Probes Nr.S-7573) zugege- 
ben. Danach wurde 2 h bei 30°C gefarbt. Die Selektion und Ablage erfolg- 
te mittels eines BectonDickinson FacsVantage+Diva Option. Die Selektion 

30 erfolgt zuerst nach Grolie, urn einzelne Sporen von Aggregaten und Ver- 
unreinigungen zu trennen. Dann wurden diese Sporen nach ihrer Fluores- 
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zenz (Anregung = 488nm Emission = 530 nm) sortiert abgelegt. Die linke 
Schulter der GaulJ-Kurve der Fluoreszenzhaufigkeitsverteilung enthielt die 
einkernigen Sporen. 

5 Anschlieftend wurden die Sporen auf MEP-Agarplatten ausplattiert und 
neue Sporen erzeugt. 

Diese Sporen wurden analog zur Vorschrift von Roncero et al. auf Medium 
mit 5-Carbon-5-deazariboflavin plattiert, das zusatzlich Hygromycin ent- 
10 hielt. 

Hierdurch wurden homokaryonte Zellen des Genotyps hyg R und dar" se- 
lektiert. 

15 

2) Herstellung homonukleater Stamme durch Kernreduktion und Se- 
lektion mit FACS 

Zur Reduzierung der Anzahl von Kernen pro Spore wurde vor der Selekti- 
on eine Behandlung von Sporensuspensionen mit MNNG (N-Methyl-N- 
20 nitro-N-nitrosoguanidin) durchgefuhrt, und so durch chemische Mutagene- 
se eine Kernreduktion erzielt 

Hierfur wurde zunachst eine Sporensuspension mit 1 x 10 7 Sporen/ml in 
Tris/HCI-Puffer, pH 7,0 hergestellt. Der Sporensuspension wurde MNNG 
25 in einer Endkonzentration von 100 ug/ml zugegeben. Die Zeit der lnkuba- 
tioh in MNNG wurde so gewShlt, dass die Oberlebensrate der Sporen ca. 
5% betrug. Nach Inkubation mit MNNG wurden die Sporen dreimal mit 1g/l 
Span 20 in 50 mM Phosphatpuffer pH 7,0 gewaschen und nach der unter 
1) beschriebenen Methode sortiert bzw. selektiert. 



WO 2004/063359 



69 



PCT/EP2004/000099 



Alternativ konnten zur Reduktion der Kemzahl in den Sporen auch Ront- 
gen - und UV-Strahlen eingesetzt warden, wie es von Cerda-Olmedo und 
Patricia Reau in Mutation Res., 9 (1970), 369-384 beschrieben wurde. 

5 

3) Herstellung homonukleater Stamme durch Selektion auf rezessive 
Selektionsmarker 

Als rezessiver Selektionsmarker zur Selektion homonukleater Mycelien 
kommt beispielsweise der rezessive Selektionsmarker pyrG in Frage. 

10 Wildtyp-Stamme von Blakeslea trispora sind pyrG*. Diese Stamme kSnnen 
nicht in Gegenwart des Pyrimidin-Analogs 5-Fluororotat (FOA) wachsen, 
weil sie FOA durch die Orotidin-5'-monophosphatdecarboxylase zu letha- 
len Metaboliten umsetzen. Gentechnisch veranderte Blakesleaa, die ho- 
monukleat pyrG" sind, fehlt die Enzymaktivitat Orotidin-5- 

15 monophosphatdecarboxylase. Folglich konnen diese pyrG~-Stamme 5- 
Fluororotat nicht verwerten. Die Stamme wachsen daher in Gegenwart 
von FOA und Uracil. Im Fall der Kopplung der Mutation pyrG" und der In- 
sertion von Fremd-DNA auf dem Kern einer einkemigen Spore, kann aus 
dieser Spore homonukleates rekombinantes Pilzmycel gebildet werden. 

20 

ZunSchst wurde durch Insertion eines Fragentes von pyrG (SEQ ID NO: 
65) aus Blakeslea trispora in pBinAHyg das Plasmid pBinAHygBTpyrG- 
SCO (SEQ ID NO: 36, Fig. 4) erzeugt. Dieses Plasmid wurde in Blakelea 
trispora transformiert und fuhrte dort durch homologe Rekombination zur 
25 Disruption von pyrG. 

Homonukleate GVO von Blakeslea trispora mit dem Phanotyp pyrG" wur- 
den folgendermaRen selektiert. Zur Agrobakterium-vermittelten Transfor- 
mation von pBinAHygBTpyrG-SCO wurde wie oben beschrieben auf MEP 
30 (30 g/l Maizextrakt, 3 g/l Pepton, pH 5,5, 18 g/l Agar) mit 100 mg/l Cefota- 
xim und 100 mg/l Hygromycin plattiert. Die Sporen der Transformanten 



WO 2004/063359 



70 



PCT/EP2004/000099 



wurden mit 10 ml Tris-HCI 50mM + 0,1% Span20 pro Agar-Platte abge- 
schwemmt. Die Sporenkonzentration betrug 0,5 bis 0,8 x 10 7 Sporen pro 
ml. Die Sporen wurden anschlieftend auf FOA-Medium mit 100 mg/l Cefo- 
taxim und 100 mg/l Hygromycin ausplattiert. FOA-Medium enthielt pro Li- 

5 ter 20 g Glucose, 1 g FOA, 50 mg Uracil, 200 ml Citrat-Puffer (0,5 M, pH 
4,5) und 40 ml Spurensalzlosung nach Sutter, 1975, PNAS, 72:127). Ho- 
monukleate pyrG~-Mutanten zeigten Wachstum auf dem Uracil-haltigen 
FOA-Medium; aber kein Wachstum bei Plattierung auf FOA-Medium ohne 
Uracil. Auf die gleiche Weise wurden aus den im folgenden beschriebenen 

10 GVO von Blakeslea trispora zur Herstellung von Xanthophyllen homo- 
nukleate GVO hergestellt. 

Altemativ ist es moglich die Sporen analog zur Vorschrift von Roncero et 
al. auf Medium mit 5-Carbon-5-deazariboflavin zu plattieren, das zusatz- 
15 lich Hygromycin enthait (Roncero et al., 1984, Mutation Research, 125: 
195 - 204). Hierdurch werden homokaryonte Zellen des Genotyps hyg R 
und dar selektiert. Nach diesem Prinzip werden homokaryonte StSmme 
von Blakeslea trispora mit dem PhSnotyp hyg R und dar" erzeugt. 

20 

Ausfuhrungsbeispiele zur Herstellung von gentechnisch veranderten 
Organismen von Blakeslea trispora fur die Herstellung von Caroti- 
noiden und Carotinoidvorstufen 

Die Erzeugung der im folgenden genannten Plasmide erfolgte durch die 
25 Methode „overlap-extension PCR" und durch anschliefiende Insertion der 
Amplifikationsprodukte in das Plasmid pBinAHyg. Die Methode overlap- 
extension PCR" erfolgte wie in Innis et al. (Eds.) PCR protocols: a guide to 
methods and applications, Academic Press, San Diego beschrieben. Die 
Transformation der pBinAHyg-Abkdmmlinge und die Herstellung homo- 
30 nukleater gentechnisch veranderter St§mme von Blakeslea trispora erfolg- 
te wie oben beschrieben. 
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Gentechnisch veranderte Stamme von Blakeslea trispora zur Herstel- 
lung von Zeaxanthin 

Folgende Plasmide (Abkommlinge von pBinAHyg) wurden zur gentechni- 
5 schen Veranderung von Blakeslea trispora fur die Herstellung von Zea- 
xanthin verwendet, codieren also u.a. Hydroxylasen (crtZ): 

p-tef1-HPcrtZ, enthaltend Gen der Hydroxylase HPcrtZ (SEQ ID 
NO: 70) aus Haematococcus pluvialis Flotow NIES-144 (Accession 
No. AF 162276) unter Kontrolle des ptefl Promotors aus Blakeslea 
10 trispora (Seq. pBinAHygBTpTEFI -HPcrtZ, SEQ ID NO: 37, Fig. 5); 

p-carRA-HPcrtZ, enthaltend Gen der Hydroxylase HPcrtZ aus 
Haematococcus pluvialis Flotow NIES-144 unter Kontrolle des 
Promotors pcarRA aus Blakeslea trispora (Seq. pBinAHyg- 
BTpcarRA-HPcrtZ, SEQ ID NO: 38, Fig. 6) 

15 - p-carB-HPcrtZ, enthaltend Gen der Hydroxylase HPcrtZ aus Hae- 
matococcus pluvialis Flotow NIES-144 unter Kontrolle des Promo- 
tors pcarB aus Blakeslea trispora (Seq. pBinAHygBTpcarB-HPcrtZ, 
SEQ ID NO: 39, Fig. 7) 

p-carRA-HPcrtZ-TAG-3'carA-IR, enthaltend Gen der Hydroxylase 
20 HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 unter Kon- 

trolle des Promotors pcarRA aus Blakeslea trispora. Stromabwarts 
des Gens der Hydroxylase ist eine Inverted-Repeat-Struktur lokali- 
siert, die aus dem 3-Ende von carA und der stromabwarts von carA 
gelegenen Region stammt (IR, SEQ ID NO: 74, .Inverted Repeat V 
25 ca. 350 bp von carA, dann ca. 200 bp .Loop' und anschlieftend ca. 

350 bp .Inverted Repeat 2') (Seq. pBinAHyg-BTpcarRA-HPcrtZ- 
TAG-3'carA-IR, SEQ ID NO: 40, Fig. 8); 

p-carRA-HPcrtZ-GCG-3'carA-IR, enthaltend Gen der Hydroxylase 
HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 unter Kon- 
30 trolle des Promotors pcarRA aus Blakeslea trispora. Das Gen der 
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Hydroxylase ist mit einer Inverted-Repeat-Struktur fusioniert, die 
aus dem 3-Ende von carA und der stromabwarts von carA gelege- 
nen Region stammt (IR, SEQ ID NO: 74, .Inverted Repeat 1' ca. 
350 bp von carA, dann ca. 200 bp .Loop' und anschliedend ca. 350 
5 bp .Inverted Repeat 2'). Das abgeleitete Fusionsprotein besteht 

folglich aus der Hydroxylase von Haematococcus pluvialis und dem 
Carboxyterminus von CarA aus Blakeslea trispora (Seq. pBinAHyg- 
BTpcarRA-HPcrtZ-GCG-3'carA-IR, SEQ ID NO: 41, Fig. 9); 

p-tef1-EUcrtZ, enthaltend Gen der Hydroxylase EUcrtZ (SEQ ID 
10 NO: 71) aus Erwinia uredova 20D3 (Accession No. D90087) unter 

Kontrolie des ptefl Promotors (Seq. pBinAHygBTpTEFI -EUcrtZ. 
SEQ ID NO: 42. Fig. 10); 

p-carRA-EUcrtZ, enthaltend Gen der Hydroxylase EUcrtZ aus Erwi- 
nia uredova 20D3 unter Kontrolie des Promotors pcarRA aus Bla- 
15 keslea trispora (Seq. pBinAHygBTpcarRA-EUcrtZ, SEQ ID NO: 43, 

Fig. 11); 

p-carB-EUcrtZ, enthaltend Gen der Hydroxylase EUcrtZ aus Erwi- 
nia uredova 20D3 unter Kontrolie des Promotors pcarB aus Blakes- 
lea trispora (Seq. pBinAHygBTpcarB-EUcrtZ, SEQ ID NO: 44, Fig. 
20 12); 

p-gpdA-HPcrtZ-t-crtZ, enthaltend Gen der Hydroxylase HPcrtZ aus 
Haematococcus pluvialis Flotow NIES-144 unter Kontrolie des 
gpdA Promotors und des Terminators t-crtZ; d.h. des stromabwarts 
von crtZ aus Haematococcus pluvialis Flotow NIES-144 gelegenen 
25 Sequenzabschnitts (SEQ ID NO: 73) (Seq. pBinAHyg-gpdA-HPcrtZ- 

tcrtZ, SEQ ID NO: 45. Fig. 13). 

p-gpdA-BTcarR-HPcrtZ-BTcarA, enthaltend Genfusion aus Genen 
der Lycopincyclase carR aus Blakeslea trispora, der Hydroxylase 
HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 und der 
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Phytoensynthase carA aus Blakeslea trispora unter Kontrolle des 
gpdA Promotors aus Aspergillus nidulans (Seq. pBinAHyg- 
carR_crtZ_carA, SEQ ID NO: 46, Fig. 14); 

5 Herstellung gentechnisch veranderter Stamme von Blakeslea trispo- 
ra zur Herstellung von Canthaxanthin 

Folgende Plasmlde (Abkommlinge von pBinAHyg) wurden zur gentechni- 
schen Veranderung von Blakeslea trispora fur die Herstellung von 
Canthaxanthin verwendet, codieren also u.a. Ketolasen (crtW): 
10 - p-tef1-NPcrtW, enthaltend das Gen der Ketolase NPcrtW (SEQ ID 
NO: 72) aus Nostoc punctiforme PCC73102 (ORF148, Accesion 
No. NZ_AABC01000196) unter Kontrolle des ptefl Promotors aus 
Blakeslea trispora (Seq. pBin AHygBTpTEF 1 -NpucrtW , SEQ ID NO: 
47, Fig. 15); 

15 - p-carRA-NPcrtW, enthaltend das Gen der Ketolase NPcrtW aus 
Nostoc punctiforme PCC73102 unter der Kontrolle des Promotors 
pcarRA aus Blakeslea trispora (Seq. pBinAHygBTpcarRA-NpucrtW, 
SEQ ID NO: 48, Fig. 16); 

p-carB-NPcrtW, enthaltend das Gen der Ketolase NPcrtW aus No- 
20 stoc punctiforme PCC73102 unter der Kontrolle des Promotors 

pcarB aus Blakeslea trispora (Seq. pBinAHygBTpcarB-NpucrtW, 
SEQ ID NO: 49, Fig. 17); 

Herstellung gentechnisch veranderter Stamme von Blakeslea trispo- 
25 ra zur Herstellung von Astaxanthin 

Folgende Plasmide (Abkommlinge von pBinAHyg) wurden zur gentechni- 
schen Veranderung von Blakeslea trispora fur die Herstellung von Asta- 
xanthin verwendet, codieren also u.a. fur Hydroxylasen (crtZ) und Ketola- 
sen (crtW): 
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p-carRA-HPcrtZ-pcarRA-NPcrtW, enthaltend das Gen der Hydroxy- 
lase HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 und das 
Gen der Ketolase NPcrtW aus Nostoc punctiforme PCC73102 
(ORF148, Accesion No. NZ_AABC01000196) beide jeweils unter 
5 Kontrolle des Promotors pcarRA aus Blakeslea trispora (Seq. pBi- 

nAHygBTpcarRA-HPcrtZ-BTpcarRA-NpucrtW, SEQ ID NO: 50, Fig. 
18); 

p-carRA-EUcrtZ-pcarRA-NPcrtW, enthaltend das Gen der Hydroxy- 
lase EUcrtZ aus Erwinia uredova20D3 (Accession No. D90087) und 
10 das Gen der Ketolase NPcrtW aus Nostoc punctiforme PCC73102 

beide jeweils unter Kontrolle des Promotors pcarRA aus Blakeslea 
trispora (Seq. pBinAHygBTpcarRA-EUcrtZ-BTpcarRA-NpucrtW, 
SEQ ID NO: 51, Fig. 19); 

15 Klonierung und Sequenzanalyse von Genen und Promotoren, die 

beispielhaft fur die gentechnische Veranderung von Blakeslea trispo- 
ra genutzt werden konnen. 

Nachfolgend werden beispielhaft die Klonierung und Sequenzierung ver- 
schiedener Gene und Promotoren aus Blakeslea trispora beschrieben. 

20 

Klonierung und Sequenzanalyse ptefl 

Die Klonierung von p-tef aus Blakeslea trispora erfolgte auf der Grundlage 
einer bereits in GenBank veroffentlichten Sequenz des Strukturgens fur 
den Translatlons-Elongationsfaktor 1-a aus Blakeslea trispora 

25 (AF1 57235). Ausgehend von dem Sequenzeintrag AF1 57235 wurden 
Primer fur die inverse PCR ausgewahlt, urn die stromaufwarts des Struk- 
turgens gelegene Promotoregion zu amplifizieren und zu sequenzieren. 
In der inversen nested PCR an 200 ng Xhol-gespaltener und zirkularisier- 
ter genomischer DNA von Blakeslea trispora ATCC14272 wurde ein 3000- 

30 bp-Fragment in folgendem Ansatz erhalten: Matrizen-DNA (1 pg genomi- 
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sche DNA von Blakeslea trispora ATCC 14272) Primer MAT344 5'- 
GGCGTACTTGAAGGAACCCTTACCG-3' (SEQ ID NO: 63) und MAT 345 
S'-ATTGATGCTCCCGGTCACCGTGATT-S' (SEQ ID NO: 64) je 0,25 pM, 
100 pM dNTP, 10 pi Herculase-Polymerasepuffer 10x, 5 U Herculase (Zu- 
5 gabe bei 85 °C), H z O ad 100 pi. Das PCR-Profil war 95 °C, 10 min (1 Zy- 
klus); 85 °C, 5 min (1 Zyklus); 60 °C, 30 s. 72 °C, 60 s, 95 °C, 30 s (30 
Zyklen); 72 °C, 10 min (1 Zyklus). Der Sequenzabschnitt, der stromauf- 
warts des vermutlichen Startcodons des Gens tefl innerhalb 3000-bp- 
Fragmentes liegt, wurde als Promotor ptef 1 bezeichnet. 

10 

Klonierung Sequenzanalyse des Gens der HMG-CoA-Reduktase aus 
Blakeslea trispora 

Zunachst wurde mlt dem Cosmidvektor pANsCosI eine Genb c ank von Bla- 
keslea trispora ATCC 14272, Mating Type (-) hergestellt. Der Vektor wur- 

15 de durch Spaltung mit Xbal linearisiert und anschlieftend dephosphoryliert. 
Eine weitere Spaltung mit mit BamHI schuf die Insertionsstelle, in welche 
die mit Sau3AI partiell gespaltene und dephosphorylierte genomische 
DNA von Blakeslea trispora ligiert wurde. Die derart gebildeten Cosmide 
wurden anschlie&end in vitro verpackt und in Escherichia coli Ubertragen. 

20 Auf der Grundlage der bekannten Sequenz eines Fragmentes des HMG- 
CoA-Reduktase codierenden Gens aus Blakeslea trispora (Eur. J. Bio- 
chem 220, 403-408 (1994)) wurde eine 315-bp-DNA-Sonde durch folgen- 
de PCR hergestellt. Reaktionsansatz: 1 pg genomische DNA von Blakes- 
lea trispora ATCC 14272, Primer MAT314 5'- 

25 CCGATGGCGACGACGGAAGGTTGTT-3* [SEQ ID NO 79] und MAT315 
S'-CATGTTCATGCCCATTGCATCACCT-S' [SEQ ID NO 80] je 0,25 pM, 
100 pM dNTP, 10 pi Herculase-Polymerasepuffer 10x, 5 U Herculase (Zu- 
gabe bei 85 °C), H 2 0 ad 100 pi. Das PCR-Profil war 95 °C, 10 min (1 Zy- 
klus); 85 °C, 5 min (1 Zyklus); 58 °C, 30 s. 72 °C, 30 s, 95 °C, 30 s (30 

30 Zyklen); 72 °C, 10 min (1 Zyklus). 
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Mit dieser DNA-Sonde wurde die Cosmid-Genbank durchmustert. Es wur- 
de ein Klon identifiziert, dessen Cosmid mit der DNA-Sonde hybridisierte. 
Die Insertion dieses Cosmids wurde sequenziert. Die DNA-Sequenz ent- 
hielt einen Abschnitt, der dem Gen einer HMG-CoA-Reduktase zugeord- 
5 net wurde [HMG-CoA-Red.gb]. 

Klonierung und Sequenzanalyse carB 

(carB = Gen der Phytoendesaturase aus Blakeslea trispora) 

Aus dem Sequenzvergleich der Peptidsequenzen von Phytoendesatura- 

10 sen und dem Vergleich der zugehorigen DNA-Sequenzen von Phycomy- 
ces blakesleeanus, Cercospora nicotianae, Phaffia rhodozyma und Neu- 
rospora crassa wurden die degenerierten Primer MAT182 5'- 
GCNGARGGNATHTGGTA-3" (SEQ ID 52) und MAT192 5*- 
TCNGCNAGRAADATRTTRTG-3' (SEQ ID 53) abgeleitet. Die PCR wurde 

15 in 100 pi Ansatzen durchgefuhrt. Diese enthielten 200 ng genomische 
DNA von Blakeslea trispora ATCC14272, 1 pM MAT182, 1 pM MAT192, 
100 pM dNTP, 10 pi Pfu-Polymerasepuffer 10x, 2,5 U Pfu-Polymerase 
(Zugabe bei 85 °C), H 2 0 ad 100 pi. 

20 Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min (1 Zyklus); 40 
°C, 30 s, 72 °C, 30 s, 95 °C, 30 s (35 Zyklen); 72 °C, 10 min (1 Zyklus). 

Hiermit wurde ein 358-bp-Fragment erhalten, dessen abgeleitete Peptid- 
sequenz Ahnlichkeit zu den Sequenzen der Phytoendesaturasen aufwies. 

25 Durch die Methode der inversen PCR (Innis et al. in PCR protocols: a 
guide to methods and applications. 1990. S. 219-227) wurden nach dem 
Prinzip des Chromosome-Walking die Genregionen stromaufwarts und 
stromabwarts des 350-bp-Fragmentes folgendermaften amplifiziert, klo- 
niert und sequenziert: 

30 (i) ein 1,1-kbp-Fragment durch PCR mit den Primern MAT219 5'- 
AAGTGACACCGGTTACACGCTTGTCTT-3' (SEQ ID 54) und MAT 
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220 5'-GCTTATCACCATCTGTTACCTCCTTGC-3' (SEQ ID 55) er- 
halten aus 200 ng EcoRI-gespaltener und zirkularisierter genomi- 
scher DNA von Blakeslea trispora ATCC14272, 0,25 pM MAT219, 
0,25 pM MAT220, 100 pM dNTP, 10 pi Herculase- 
5 Polymerasepuffer 10x, 5 U Herculase (Zugabe bei 85 °C), H 2 0 ad 

100 pi. Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min 
(1 Zyklus); 60 °C, 30 s. 72 °C, 60 s, 95 °C, 30 s (30 Zyklen); 72 °C, 
10 min (1 Zyklus), 

(ii) ein 2,9-kbp-Fragment durch PCR mit den Primern MAT219 und 
10 MAT220 erhalten aus 200 ng Xbal-gespaltener und zirkularisierter 

genomischer DNA von Blakeslea trispora ATCC14272, 0,25 pM 
MAT219, 0,25 pM MAT220, 100 pM dNTP, 10 pi Herculase- 
Polymerasepuffer 10x, 5 U Herculase (Zugabe bei 85 °C), H 2 0 ad 
100 pi. Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min 
15 (1 Zyklus); 60 °C, 30 s, 72 °C, 3 min, 95 °C, 30 s (30 Zyklen); 72 °C, 

10 min (1 Zyklus); 

Der klonierte Sequenzabschnitt ist schematise* in Fig. 20 (SEQ ID NO 77) 
dargestellt. Die Sequenzierung erfolgte in Strang- und Gegenstrangrich- 
tung mit den klonierten Fragmenten sowie mit den PCR-Produkten. Die 
20 Sequenz des klonierten Sequenzabschnitts ist in Fig. 21 (SEQ ID NO 78) 
gezeigt. 



Sequenzvergleiche 

Die Nukleotidsequenz von carB und die Peptidsequenz des abgeleiteten 
25 Proteins CarB wurden mit den bekannten Sequenzen verwandter Proteine 
verglichen. Zum Sequenzvergleich wurden die Programme GAP und 
BESTFIT eingesetzt. 



30 CarB - Identische Aminoacylreste nach GAP 

Programmeinstellungen: 
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Gap Weight: 8 

Length Weight: 2 

Average Match: 2.912 

Average Mismatch: -2.003 
5 Dabei wurde folgende Werte fur die Obereinstimmung der Aminosauren zu 

CarB aus Blakeslea trispora ATCC14272 in % gefunden: 

Phycomyces blakesleeanus: 72,491 

Phaffia rhodozyma: 50,460 

Neurospora crassa: 47,943 
10 Cercospora nicotianae: 47,740 

CarB -Identische Aminoacylreste nach BESTFIT 

Programmeinstellungen: 
Gap Weight: 8 
15 Length Weight: 2 

Average Match: 2.912 
Average Mismatch: -2.003 

Dabei wurde folgende Werte fOr die Obereinstimmung der Aminosauren zu 
CarB aus Blakeslea trispora ATCC14272 in % gefunden: 
20 Phycomyces blakesleeanus: 73,380 
Phaffia rhodozyma: 53,175 
Neurospora crassa: 5 1 ,896 

Cercospora nicotianae: 50,791 

25 carB - Identische Basen nach GAP 

Programmeinstellungen: 
Gap Weight: 50 
Length Weight: 3 
Average Match: 10.000 
30 Average Mismatch: 0.000 
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Dabei wurde folgende Werte fQr die Obereinstimmung der Basen zu CarB 
aus Blakeslea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 64,853 
Cercospora nicotianae: 50,143 
5 Phaffia rhodozyma: 43,179 
Neurospora crassa: 42,130 

carB -Identische Basen nach BESTFIT 

Programmeinstellungen: 
10 Gap Weight: 50 
Length Weight: 3 
Average Match: 10.000 
Average Mismatch: -9.000 

Dabei wurde folgende Werte fQr die Obereinstimmung der Basen zu CarB 
15 aus Blakeslea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 68,926 
Phaffia rhodozyma: 62,403 
Neurospora crassa: 60,230 
Cercospora nicotianae: 56,884 

20 

Klonierung zur Expression von carB 

Zur Klonierung und Expression von carB aus Blakeslea trispora wurden 
von dem oben beschriebenen klonierten Sequenzabschnitt aus Blakeslea 
trispora in sechs Leserastem die mSglichen Proteinsequenzen abgeleitet. 

25 Diese Proteinsequenzen wurden mit den Sequenzen der Phytoendesatu- 
rasen aus Phycomyces blakesleeanus, Phaffia rhodozyma, Neurospora 
crassa, Cercospora nicotianae verglichen. Auf der Grundiage des Se- 
quenzvergleiches wurden im klonierten Sequenzabschnitt der genomi- 
schen DNA von Blakeslea trispora drei Exons identifiziert, die zusammen- 

30 gefOgt eine codierende Region ergeben, deren abgeleitetes Genprodukt 
Ober die gesamte Lange 72,7% identische Aminoacylreste mit der Phy- 
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toendesaturase CarB aus Phycomyces blakesieeanus aufweist. Dieser 
Sequenzabschnitt aus drei m6glichen Exons und zwei moglichen Introns 
wurde daher als Gen carB bezeichnet. Zur Clberprufung der vorhergesag- 
ten Genstruktur wurde die codierende Sequenz von carB aus Blakeslea 

5 trispora durch PCR mit cDNA von Blakeslea trispora als Matrize und mit 
den Primern Bol1425 5- 

AGAGAGGGATCCTTAAATGCGAATATCGTTGC-3' (SEQ ID 56) und 
Bc-11426 5'-AGAGAGGGATCCATGTCTGATCAAAAGAAGCA-3' (SEQ ID 
57) erzeugt. Das erhaltene DNA-Fragment wurde sequenziert. Die Lokali- 

10 sation von Exons und Introns wurde durch Verglelch der cDNA mit der 
genomischen DNA von carB bestatigt. In Fig. 21 ist die codierende Se- 
quenz von carB schematisch dargestellt. Zur Expression von carB in 
Escherichia coli wurde zunachst die Ndel-Schnittstelle in carB durch die 
Methode overlap extension PCR entfemt sowle am 5'-Ende des Gens eine 

15 Ndel-Schnittstelle und am 3-Ende eine BamHI-Schnittstelle eingefQgt. 
Das erhaltene DNA-Fragment wurde mit dem Vektor pJOE2702 ligiert. 
Das erhaltene Plasmid wurde als pBT4 bezeichnet und zusammen mit 
pCAR-AE in Escherichia coli XL1-Blue kloniert. Die Expression erfolgte 
durch Induktion mit Rhamnose. Der Nachweis der Enzymaktivitat erfolgte 

20 durch Nachweis der Lycopinsynthese via HPLC. Die Klonierungsschritte 
sind im folgenden beschrieben: 

PCR 1.1: 

Ca. 0,5 ug cDNA von Blakeslea trispora, 0,25 uM MAT350 5*- 
25 ACTTTATTGGATCCTTAAATGCGAATATCGTTGCTGC-3' (SEQ ID 58), 
0,25 uM MAT244 5'- 

GTTCCAATTGGCCACATGAAGAGTAAGACAGGAAACAG-3' (SEQ ID 
59), 100 uM dNTP, 10 pi Pfu-Polymerase-Puffer (I0x), 2,5 U Pfu- 
Poiymerase (Zugabe bei 85 °C, "hot start") und H 2 0 ad 100pL. 
30 Temperaturprofil: 
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1. 95 °C 10 min, 2. 85 °C 5 min, 3. 40 °C 30s, 4. 72 °C 1 min 30 s, 5. 95 
°C 30 s, 6. 50 °C 30 s, 7. 72 °C 1 min 30 s, 8. 95 °C 30 s, 9. 72 °C 10min 
Zyklen: (1-2.) 1x, (3-5.) 5x, (6-8.) 25x, (9.) 1x 

5 PCR1.2: 

Ca. 0,5 pg cDNA von Blakeslea trispora, 0,25 pM MAT243 5'- 
CCTGTCTTACTCTTCATGTGGCCAATTGGAACCAACAC-3' (SEQ ID 
60), 0,25 pM MAT353 5'- 

CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3 , (SEQ ID 61), 
w 100 pM dNTP, 10 pi Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu-Polymerase 
(Zugabe bel 85 °C, "hot start") und H 2 0 ad 100 pL. 
Temperaturprofil: 

1. 95 °C 10 min, 2. 85 °C 5 min, 3. 40 °C 30s, 4. 72 °C 1 min 30 s, 5. 95 
°C 30 s, 6. 50 °C 30 s, 7. 72 °C 1 min 30 s, 8. 95 °C 30s, 9. 72 °C 10min 
15 Zyklen: (1 -2.) 1x, (3-5.) 5x, (6-8.) 25x, (9.) 1x 

Reinigung der PCR-Fragmente aus PCR 1.1, 1.2 

Dazu wurde PCR 2 zur Herstellung der codierenden Sequenz von carB 
aus Blakeslea trispora fQr die Klonierung in pJOE2702 durchgefuhrt: 
20 Ca. 50 ng Produkt aus PCR 1.1 und ca. 50 ng Produkt aus PCR1.2 mit 

0. 25 pM MAT350 5'- 
ACTTTATTGGATCCTTAAATGCGAATATCGTTGCTGC-3 , (SEQ ID NO 
58), 0,25 pM MAT353 5'- 
CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3' (SEQ ID NO 

25 61), 100 pM dNTP, 10 pL Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu- 
Polymerase (Zugabe bei 85 °C, "hot start") und H 2 0 ad 100 pL. 
Temperaturprofil: 

1. 95°C 10 min, 2. 85 °C 5 min, 3. 59 °C 30 s, 4. 72 °C 2 min, 5. 95 °C 30 
s, 6.72°C 10 min 

30 Zyklen: (1-2.) 1x, (3-5.) 22x, (6.) 1x 
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Anschlie&end erfolgte eine Reinigung des erhaltenen Fragmentes (~ 1,7 
kbp), eine Ligation in Vektor pPCR-Script-Amp, eine Klonierung in Esche- 
richia coli XL1-Blue, Sequenzierung der Insertion, Spaltung mit Ndel und 
BamHI sowie eine Ligation in pJOE2702. Das erhaltene Plasmid wurde als 
5 pBT4 bezeichnet. 

Charakterisierung und Nachweis der Enzymaktivitat von CarB (Phy- 
toendesaturase) 

Das von carB abgeleitete Genprodukt wurde als CarB bezeichnet. CarB 
10 weist auf Grundlage der Peptidsequenzanalyse folgende Eigenschaften 
auf: 



Der Nachweis der Enzymaktivitat erfolgte in vivo. Wenn das Plasmid 
20 (pCAR-AE) in Escherichia coli XL1-Blue ubertragen wird, entsteht der 
Stamm Escherichia coli XL1-Blue (pCAR-AE). Dieser Stamm synthetisiert 
Phytoen. Wenn zusatzlich das Plasmid pBT4 in Escherichia coli XL1-Blue 
Qbertragen wird, entsteht der Stamm Escherichia coli XL1-Blue (pCAR- 
AE)(pBT4). Da ausgehend von carB eine enzymatisch aktive Phytoende- 
25 saturase gebildet wird, produziert dieser Stamm Lycopin. 



15 



Lange: 

Molekulare Masse: 
Isoelektrische Punkt: 
Katalytische Aktivitat: 
Edukt: 



Produkt: 



EC-Nummer: 



582 Aminoacylreste 

66470 

6,7 

Phytoendesaturase 
Phytoen 
Lycopin 
EC 1.14.99- 



Die Plasmide pCAR-AE und pBT4 wurden daher in Escherichia coli uber- 
tragen. Nach Wachstum in Flussigkultur wurden die Carotinoide aus den 
Zellen extrahiert und charakterisiert (vgl. oben). 
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Durch HPLC Analyse wurde nachgewiesen, dali der Stamm Escherichia 
coli XL1-Blue (pCAR-AE) Phytoen und der Stamm Escherichia coli XL1- 
Blue (pCAR-AE)(pBT4) Lycopin produziert. CarB weist folglich die Enzym- 
aktivitat einer Phytoendesaturase auf. 

5 

Herstellung gentechnisch veranderter Stamme von Biakeslea trispo- 
ra zur Herstellung von Phytoen 

Nachfolgend werden beispielhaft die Herstellung von gentechnisch veran- 
derten Organismen zur Herstellung von Phytoen beschrieben. 

10 

Vector pBinAHygAcarB zur Erzeugung von carB" -Mutanten von Bia- 
keslea trispora 

FQr die Deletion von carB in Biakeslea trispora wurde der Vektor pBinA- 
HygAcarB (SEQ. ID. NO:62, Fig. 22) konstruiert. Der Vorlaufer von pBi- 
15 nAHygAcarB ist pBinAHyg (SEQ. ID. NO:3, Fig. 2). pBinAHyg wurde fol- 
gendermallen konstruiert: 

Aus dem Plasmid pANsCosI (SEQ. ID. NO:4, Fig. 1, Osiewacz, 1994, 
Curr. Genet. 26:87-90) wurde die gpdA-hph Kassette als Bglll/Hindlll 
Fragment isoliert und in das BamHI/Hindlll geoffnete binare Plasmid 

20 pBin19 (Bevan, 1984, Nucleic Acids Res. 12:8711-8721) ligiert. Der so 
erhaltene Vektor wurde als pBinAHyg bezeichnet und enthalt das E. coli 
Hygromycin-Resistenzgen (hph) unter Kontrolle des gpd Promotors und 
des trpC Terrminators aus Aspergillus nidulans sowie die entsprechenden 
Bordersequenzen, die fur den DNA-Transfer von Agrobacterium notwen- 

25 dig sind. 

Die Amplifikation der codierenden Sequenz von carB mit den Primem 
MAT350 (SEQ ID NO 58) und MAT353 (SEQ ID NO 61) mittels PCR wur- 
de mit den folgenden Parametem durchgefuhrt: 
30 50 ng pBT4 mit 0,25 uM MAT350 5'-ACTTTATTGGATCCTTAAAT- 
GCGAATATCGTTGCTGC-3', 0,25 [iM MAT353 5'- 
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CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3', 100 uM 
dNTP, 10 uL Pfu-Polymerase-Puffer, 2,5 U Pfu-Polymerase (Zugabe bei 
85 °C, "hot start") und ad 100 uL H 2 0 
Temperaturprofil: 

5 1 . 95 °C 10 min, 2. 85 °C 5 min, 3. 58 °C 30s, 4. 72°C 2 min, 5. 95 °C 30s, 
6. 72 °C 10 min. 

Zyklen: (1.-2.) 1x, (3-5.) 30x, (6.) 1x 

AnschlieiJend erfolgte eine Reinigung des erhaltenen Fragmentes (~ 1,7 
10 kbp), eine Spaltung mit Hindlll, eine weitere Reinigung des 364-bp-Hindlll- 
Fragments-carB, gefolgt von einer Spaltung von pBinAHyg mit Hindlll, eine 
Ligation von 364-bp-Hindlll-Fragments-carB in pBinAHyg, eine Transfor- 
mation des Vektors in Escherichia coli und eine Isolierung des Konstruktes 
und Bezeichnung als pBinAHygAcarB wie oben beschrieben. Altemativ 
15 erfolgte eine partielle Spaltung mit Hindlll und die Klonierung eines grolie- 
ren Hindill-Fragmentes aus carB in pBinAHyg zur Herstellung von pBinA- 
HygAcarB. 

20 Erzeugung von carB" -Mutanten von Blakeslea trispora 

Zunachst wurde das Plasmid pBinAHygAcarB in den Agrobakterienstamm 
LBA 4404 Obertragen, z. B. durch Elektroporation (vgl. oben). Anschlie- 
(iend wurde das Plasmid von Agrobacterium tumefaciens LBA 4404 in 
Blakeslea trispOra ATCC 14272 und in Blakeslea trispora ATCC 14271 
25 Obertragen (vgl. oben). Der erfolgreiche Nachweis des Gentransfers in 
Blakesleslea trispora erfolgte Qber Polymerase-Kettenreaktion nach fol- 
gendem Protokoll: 

Ca. 0,5 ug DNA aus Blakeslea trispora ATCC 14272 carB- bzw. ATCC 
14271 carB" wurden mit 0,25 uM Primer hph forward 5'- 
30 CGATGTAGGAGGGCGTGGATA-3' (SEQ ID NO 5), 0,25 uM Primer hph 
reverse 5'-GCTTCTGCGGGCGATTTGTGT-3' (SEQ ID NO 6), 100 pM 
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dNTP, 10 pL Herculase-Polymerase-Puffer, 2,5 U Herculase-DNA- 
Polymerase (Zugabe bei 85 °C, "hot start") und ad 100 |j| H 2 0 umgesetzt. 
Temperaturprofil: 

1. 95°C 10 min, 2. 85 °C 5 min, 3. 58 °C 1 min, 4. 72 °C 1 min, 5. 94 °C 1 
5 min, 6.72°C 10 min. 

Zyklen: (1.-2.) 1x, (3-5.) 30x, (6.) 1x 

Ais Negativkontrolle wurde eine Amplifikation des Kanamycinresistenz- 
gens aus Agrobacterium versucht. Dazu wurden folgende PCR- 

10 Bedingungen verwendet: 

Ca. 0,5 pg DNA aus Blakesiea trispora ATCC 14272 carB" bzw. ATCC 
14271 carB" wurden mit 0,25 pM Primer nptlll forward 5- 
TGAGAATATCACCGGAATTG-3' (SEQ ID NO 7), 0,25 pM Primer nptlll 
reverse S'-AGCTCGACATACTGTTCTTCC-S* (SEQ ID NO 8), 100 pM 

15 dNTP, 10 pL Herculase-Polymerase-Puffer, 2,5 U Herculase-DNA- 
Polymerase (Zugabe bei 85 °C, "hot start") und ad 100 pL H 2 0 umgesetzt. 
Temperaturprofil: 

1. 95 °C 10 min, 2. 85 °C 5 min, 3. 58 °C 1 min, 4. 72 °C 1 min, 5. 94 °C 1 
min, 6. 72 °C 10 min- 
20 Zyklen: (1-2.) 1x, (3-5.) 30x, (6.) 1x 



C) Produktion von Carotinoiden und Carotinoidvorstufen mit Blakes- 
iea trispora 

25 Zur Produktion der Carotinoide Zeaxanthin, Canthaxanthin, Astaxanthin 
und Phytoen wurden die entsprechenden gentechnisch veranderten Bla- 
kesiea trispora (+) und (-) Stamme fermentiert, das produzierte Carotinoid 
mittels HPLC Analyse nachgewiesen und isoliert. 
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Das Flussigmedium zur Produktion von Carotinoiden enthielt pro Liter: 19 
g Maismehl, 44 g Sojamehl, 0,55 g KH 2 P0 4 , 0,002 g Thiaminhydochlorid, 
10 % Sonnenblumenol. Der pH wurde mit KOH auf 7,5 eingestellt. 

5 Zur Herstellung der Carotinoiden wurden SchUttelkolben mit Sporensus- 
pensionen von (+) und (-) Stammen der GVO von Blakeslea trispora be- 
impft. Die SchUttelkolben wurden bei 26 °C mit 250 rpm fOr 7 Tage inku- 
biert. Altemativ wurde zu Mischungen der Stamme nach 4 Tagen Trispor- 
sauren zugegeben und weitere 3 Tage inkubiert. Die Endkonzentration der 

10 Trisporsauren betrug 300 - 400 ug/ml. 

Extraktion und Analytik 
Extraktion: 

1 . Entnahme von 10 ml Kultursuspension 
15 2. Zentrifugation, 10 min, 5.000 x g 

3. Verwerfen des Oberstandes 

4. Resuspendierung des Pellets in 1 ml Tetrahydrofuran (THF) durch 
Vortexen 

5. Zentrifugation, 5 min, 5.000 x g 
20 6. Abnahme der THF-Phase 

7. Wiederholung der Schritte 4.-6. (2 x) 

8. Vereinigung der THF-Phasen 

9. Zentrifugation der vereinigten THF-Phasen 5 min bei 20.000 x g, 
urn Reste der wadrigen Phase abzutrennen 

25 

Analytik 

Messung von Phytoen mittels HPLC 

Saule: ZORBAX Eclipse XDB-C8, 5 urn, 150*4,6 mm 

30 Temperatur: 40 °C 

Flulirate: 0,5 ml/min 
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lnjektionsvolumen:10 pi 
Detektlon: UV 220 nm 



Stoppzeit: 12 min 

Nachlaufzeit: 0 min 



5 



Maximaldruck: 



350 bar 



Eluent A: 



Eluent B: 



50 mM NaH 2 P04, pH 2,5 mit Perchlorsaure 
Acetonitril 



Gradient: 



10 



Zeit [min] 
0 



A [%] 
50 



B [%] 
50 



FluB [ml/min] 
0,5 



12 



50 



50 



0,5 



Als Matrix wurden Extrakte der Fenmentationsbriihen verwendet. Vor der 
HPLC wurde jede Probe wird durch ein 0,22 pm Filter filtriert. Die Proben 
15 wurden kiihl gehalten und vor Licht geschutzt. Zur Kalibrierung wurden 
jeweils 50 - 1000 mg/l eingewogen und in THF gel8st. Als Standard wurde 
Phytoen verwendet, welches unter den gegebenen Bedingungen eine Re- 
tentionszeit von 7,7 min. aufweist. 

20 Messung von Lycopin, ^-Carotin, Echinenon, Canthaxanthin, Crypto- 
xanthin, Zeaxanthin und Astaxanthin mittels HPLC 

Saule: Nucleosil 1 00-7 C1 8, 250*4,0 mm (Macherey & Nagel) 

Temperatur: 25 °C 

FlufJrate: 1 ,3 ml/min 

25 lnjektionsvolumen:10 pi 

Detektion: 450 nm 

Stoppzeit: 15min 

Nachlaufzeit: 2 min 

Maximaldruck: 250 bar 
30 Eluent A: 10% Aceton, 90% H 2 0 

Eluent B: Aceton 
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Gradient: 



Zeit [min] 
0 



A [%] 
30 



B [%] 
70 



Fluft [ml/min] 



5 



10 



12 



13 



5 



5 



30 



95 



95 



70 



1,3 
1,3 
1,3 
1,3 



Als Matrix wurden Extrakte der Fermentationsbrahen verwendet. Vor der 
HPLC wurde jede Probe wird durch ein 0.22 urn Filter filtriert. Die Proben 

10 wurden kilhl gehalten und vor Licht geschOtzt. Zur Kalibrierung wurden 
jeweils 10 mg eingewogen und in 100 ml THF gelost. Als Standard wurden 
folgende Carotinoide mit folgenden Retentionszeiten eingesetzt B-Carotin 
(12,5 min), Lycopin (11,7 min), Echinenon (10,9 min), Cryptoxanthin (10,5 
min), Canthaxanthin (8,7 min), Zeaxanthin (7,6 min) und Astaxanthin (6,4 

15 min) [s. Fig. 23]. 

Produktion von Zeaxanthin mit gentechnisch veranderten Stammen 
von Blakeslea trispora 

Nachfolgend wird beispielhaft die Herstellung von Zeaxanthin mit gen- 
20 technisch veranderten Organismen (GVO) von Blakeslea trispora be- 
schrieben. 

Durch Agrobakterium-vermittelte Transformation wurde der Vektor pBinA- 
HygBTpTEFI -HPcrtZ in Blakeslea trispora ubertragen (s.o.). Ein Hygro- 
mycin-resistenter Klon wurde isoliert und auf eine Kartoffel-Glucose- 

25 Agarplatte (Merck KGaA, Darmstadt) ubertragen. 

Nach drei Tagen Inkubation bei 26°C wurde ausgehend von dieser Platte 
ein Sporensuspension hergestellt. Ein 250-ml-Erlenmeyerkolben ohne 
Schikanen mit 50 ml Growth-Medium (Maismehl 47 g/l, Sojamehl 23 g/l, 
KH 2 P0 4 0,5 g/l, Thiamin-HCI 2.0 mg/l, pH mit NaOH vor der Sterilisa- 

30 tion auf 6,2-6,7 eingestellt) wurde mit 1x1 0 5 Sporen beimpft. Diese Vorkul- 
tur inkubierte 48 Stunden bei 26 °C und 250 upm. FOr die Hauptkultur 
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wurde ein 250-ml-Erlenmeyerkolben ohne Schikane enthaltend 40 ml Pro 
duktionsmedium mit 4 ml der Vorkultur beimpft und 8 Tage bei 26 °C und 
150 uptrv inkubiert. Das Produktionsmedium enthielt Glucose 50 g/l, Ca- 
sein Acid Hydrolisate 2 g/l, Hefeextrakt 1 g/l, L-Asparagln 2 g/l, KH 2 P0 4 
5 1 ,5 g/l, MgSC-4 x 7 H 2 0 0,5 g/l, Thiamln-HCI 5 mg/l, Span20 10 g/l, Tween 
80 1 g/l, Linolsaure 20 g/l, Maisquellwasser 80 g/l. Nach 72 Stunden er- 
folgte die Zugabe von Kerosln in einer Endkonzentration von 40 g/l Kero- 
sin. 

Nach der Emte der Kulturen werden die verbliebenen ungefahr 35 ml Kul- 
10 tur mit Wasser auf 40 ml aufgefullt. AnschlieBend werden die Zellen im 
Hochdruckhomogenisator, Typ Micron Lab 40, Fa. APV Gaulin, 3 x bei 
1500 bar aufgeschlossen. 

Die Suspension mit den aufgeschlossenen Zellen wurde mit 35 ml THF 
versetzt und 60 min bei RT im Dunkeln bei 250 upm geschuttelt. Danach 
15 wurden 2 g NaCI zugegeben und das Gemisch nochmals geschuttelt. Der 
Extraktionsansatz wurde dann 10 min bei 5000 x g zentrifugiert. Die ge- 
farbte THF-Phase wurde abgenommen, die Zellmasse war vollstandig ent- 
farbt. 

Die THF-Phase wurde am Rotationsverdampfer bei 30 mbar und 30 °C 
20 auf 1 ml eingeengt und danach nochmals in 1 ml THF aufgenommen. 
Nach Zentrifugation 5 min bei 20 000 x g wurde ein Aliquot der oberen 
Phase entnommen und durch HPLC analysiert (Fig. 24, Fig. 23). 

25 P} Aufarbeituna und Isolieruna der Carotinoide bzw. des Nahrunqs- 
mittels 

Die oben unter A) angegebenen Kulturbriihen wurden wie nachfolgend 
aufgearbeitet, urn hochreine Carotinoide und ein entsprechendes Nah- 
30 rungsmittel zu erhalten. 
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Der Carotinoidgehalt der KulturbrQhen 1, 2, 3 betrug zwischen 0,5 und 1,5 
g/L 

D1) Beispiel gemSB Varainte a) HA und Variante b) HA bzw. II B 

5 Die Kulturen mit identischen Medien (insgesamt ca. 1 L) wurden am Ende 
des Kultivierungszeitraums vereinigt und mit Hilfe eines DispergiergerSts 
(Ultra.Turrax ®) homogenisiert. 

Die Feststoffkonzentration in den Medien 1 und 2 betrug 37 g/l bzw. 11 
10 g/L. Die Entwasserung der KulturbrOhe erfolgte durch eine Zentrifuge. Bei 
hohen Zellkonzentrationen bzw. hohem Feststoffgehalt des Mediums kann 
dieKulturbrilhe auch ohne vorherige fest-flQssig-Trennung weiterverarbei- 
tet werden (Medium 3: 127 g Feststoff/L Nach vorheriger Homogenisation 
mit einem Dispergiergerat (Ultra-Turrax ®) und unter standigem Ruhren 
15 der Suspension wurde die Zellmasse uber eine Schlauchpumpe auf den 
Trockner aufgegeben. Die EindUsung in den Zylinder des Laborspruh- 
trockners erfolgte dabei Qber eine Zweistoffduse mit dem Durchmesser 2,0 
mm. Eingedust wurde mit 2 bar und 4,5 Nm 3 /h Stickstoff. Die Temperatur 
am Eintritt betrug ca. 125°C bis 127°C. Das Trocknungsgas war Stickstoff 
20 mit einer Flussrate von 22 Nm 3 /h. Die Austrittstemperatur betrug zwischen 
59°C und 61 °C. Bei jeder der drei Fermentationsbriihen konnte am Zyklon 
des Sprtihtrockners rieselfahiges Produkt abgeschieden werden. Die 
WandbelSge im Turm (sofem vorhanden) platzten automatisch von der 
Gefa&wand ab und werden als unproblematisch eingestuft. 

25 

Es wurden zwischen 8 und 100 g pulvriges Nahrungsmittel erhalten, wel- 
ches direkt als Tierfuttermittel verwendet werden k6nnte. Es enthielt ca. 1- 
10 % Carotinoide bezogen auf das Trockengewicht. Die Restfeuchte be- 
trug weniger als 5%. 
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Beispiel aemaft Variante b) IIC 

D2) Extraktion mit Tetrahydrofuran 

Die Zellen aus je 40 ml der Kulturbruhen 1, 2, 3 wurden 3 x bei 1500 bar 
5 durch einen Hochdruckhomogenisator, Typ Micron Lab 40, Fa. APV Gau- 
lin aufgeschlossen. Je 20 ml der Suspensionen mit den aufgeschlossenen 
Zellen wurden mit 20 ml Tetrahydrofuran versetzt und 30 min, bei 30°C im 
RundschQttler bei 200 Upm geschuttelt. Danach wurden 2 g NaCI zuge- 
setzt und zur Phasentrennung 5 min bei 5000 x g zentrifugiert. Die THF- 
10 Phase wurde abgenommen. Danach wurde die wassrige Phase nochmals 
mit 20 ml THF extrahiert. Die Extrakte wurde vereinigt. Die Carotinoidkon- 
zentration wurde durch HPLC quantifiziert. 

D3) Extraktion mit Methyienchlorid 

15 Die Biomassenabtrennung aus der Kulturbriihe (200 mL) erfolgte durch 
Zentrifugation bei 5.000 x g fur 10 min. in einer Laborzentrifuge. 

Die abgetrennte Biofeuchtmasse (jeweils ca. 10 g bis 100 g) wurde mit 10 
- 100 mL Wasser vermischt, urn wasserlSsliche Komponenten zu entfer- 
20 nen. Die Biomasse wurde abgetrennt (Laborzentrifuge) und danach mit 
Dampf (T = 121, t = 30 min, 1 bar) im Autoklaven sterilisiert und so die 
Zellen aufgeschlossen. 

Zu den ZelltrOmmern wurden 25 - 250 g Methyienchlorid zugegeben und 
25 das Carotinoid aus der Biomasse mittels Ausschutteln extrahiert. Die Bio- 
masse wurde in einer Laborzentrifuge abgetrennt. 

Es wurde ein Ldsungsmitteltausch von Methyienchlorid zu Methanol 
durchgefuhrt, wozu die CarotinoidlSsung ca. vier Stunden bei 40°C bis 
30 60°C gehalten und Ober diesen Zeitraum kontinuierlich mit insgesamt 20 - 
200 mL Methanol versetzt wurde. Methyienchlorid wurde dabei als L6- 
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sungsmittel zurOckgewonnen. Erste Carotinoid Kristalle fielen aus. An- 
schlieftend wurde langsam, Qber 6 h auf ca. 10 °C abgekOhlt, wobei die 
Carotinoid Kristalle an Grdfie und Anzahl zunahmen. . Danach wurde die 
Mutterlauge abfiltriert und die Carotinoid Kristalle getrocknet. Ein Teil der 
5 Mutterlauge kann zum Lbsungsmitteltausch wiederverwendet werden. Der 
andere Teil wird destilliert und das so gereinigte Methanol im Losungsmit- 
teltausch wiederverwendet. 

Es wurden 0,0,08 g bis 0,24 g Carotinoid Kristalle erhalten, welche eine 
10 Reinheit (HPLC, vgl. oben) von 95 % aufwiesen. Die Ausbeute an Caroti- 
noid Kristallen betrug 80 % bezogen auf die Konzentration an Carotinoid 
in der Biomasse. 

15 Die abgetrennte methylenchloridfeuchte Biomasse wurde nach Wasser- 
dampfdestillation spruhgetrocknet (T E = 125 °C, T A = 60 °C) und kann als 
Tierfuttermitteladditiv eingesetzt werden. 

Hierzu wurde nach vorheriger Homogenisation mit einem Dispergiergerat 
20 (Ultra-Turrax) und unter standigem ROhren der Suspension die Zellmasse 
Qber eine Schlauchpumpe auf den Trockner aufgegeben. 

Die Eindusung in den Zylinder des Laborspruhtrockners erfolgte dabei 
Qber eine ZweistoffdOse mit dem Durchmesser 2,0 mm. Eingedust wurde 

25 mit 2 bar und 4,5 Nm 3 /h Stickstoff. Die Temperatur am Eintritt betrug ca. 
125°C bis 127°C. Das Trocknungsgas war Stickstoff mit einer Flussrate 
von 22 Nm 3 /h. Die Austrittstemperatur betrug zwischen 59°C und 61 °C. 
Bei jeder der drei FermentationsbrQhen konnte am Zyklon des SprQh- 
trockners rieselfahiges Produkt abgeschieden werden. Die Wandbelage im 

30 Turm (sofem vorhanden) platzten automatisch von der Gefaliwand ab und 
wurden als unproblematisch eingestuft. 
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Es wurden ca. 2,5 - 25 g pulvriges Nahrungsmittel erhalten, welches di- 
rekt als Tierfuttermittel verwendet werden kSnnte. Es enthielt ca. 0,5% - 
1,5% Carotinoide bezogen auf das Trockengewicht. Die Restfeuchte be- 
5 trug weniger als 5%. 

Insgesamt (einschlieBlich des aufgereinigeten Carotinoid-Nahaingsmittels 
betrug die Ausbeute an Carotinoid ca, 95 % bezogen auf die Ausgangs- 
menge Carotinoid in der KulturbrQhe. 



30 
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Patentanspriiche 

1. Verfahren zur Herstellung von Carotinoiden oder deren Vorstufen mit- 
tels gentechnisch veranderter Organismen der Gattung Blakeslea um- 

5 fassend 

(i) Transformation mindestens einer der Zellen, 

(ii) ggf. Homokaryotisierung der aus (i) erhaltenen Zellen, so dass 
Zellen entstehen, in denen die Kerne in einem oder in mehreren 
genetlschen Merkmalen alle gleichartig verandert sind und diese 

10 genetische Veranderung zur Auspragung bringen, und 

(vi) Selektion und Vermehrung der gentechnisch veranderten Zelle 
oder Zellen, 

(vii) Kultivierung der gentechnisch veranderten Zellen, 

(viii) Bereitstellung des von den gentechnisch veranderten Zellen 
15 produzierten Carotinoids oder der von den gentechnischen ver- 
anderten Zellen produzierten Carotinoidvorstufe. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass es sich 
um Zellen von Pilzen der Art Blakeslea trispora handelt. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass in 
20 der Transformation (i) ein Vector oder freie Nukleinsauren verwendet 

werden. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector in das Genom mindestens 
einer der Zellen integriert wird. 
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5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector einen Promotor und/oder ei- 
nen Terminator enthalt 

6. Verfahren nach einem der vorhergehenden Anspriiche 3 bis 5, da- 
5 durch gekennzeichnet, dass in der Transformation (i) ein Vector ent- 

haltend den gpd, pcarB, pcarRA und/oder ptefl Promotor und/oder den 
trpC Terminator eingesetzt wird. 

7. Verfahren nach einem der vorhergehenden Anspriiche 3 bis 6, da- 
10 durch gekennzeichnet, dass in der Transformation (i) ein Vector ent- 

haltend ein Resistenzgen eingesetzt wird. 

8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector ein Hygromycin- 
Resistenzgen (hph), insbesondere aus E. coli enthalt. 

15 9. Verfahren nach einem der vorhergehenden Anspriiche 5-8, dadurch 
gekennzeichnet, dass der gpd Promotor die Sequenz SEQ ID NO: 1 
aufweist. 

10. Verfahren nach einem der vorhergehenden Anspriiche 5-8, dadurch 
gekennzeichnet, dass der trpC Terminator die Sequenz SEQ ID NO: 

20 2 aufweist. 

11. Verfahren nach einem der vorhergehenden Anspriiche 5-8, dadurch 
gekennzeichnet, dass dertefl Promotor die Sequenz SEQ ID NO: 35 
aufweist. 

12. Verfahren nach einem der Anspriiche 6 bis 11, dadurch gekenn- 
25 zeichnet, dass der gpd Promotor und der trpC Terminator aus Asper- 
gillus nidulans stammen. 
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13.Verfahren nach einem Ansprtiche 3 bis 12, dadurch gekennzeichnet, 
dass der Vector die SEQ ID NO: 3 umfasst. 

H.Verfahren nach einem der vorhergehenden Anspriiche, dadurch ge- 
kennzeichnet, dass die Transformation (i) mittels Agrobakterien, Kon- 
5 jugation, Chemikalien, Elektroporation, Beschuss mit DNA-beladenen 
Partikeln, Protoplasten oder.Mikroinjektion durchgefuhrt wird. 

15.Verfahren nach einem der vorhergehenden Ansprtiche, dadurch ge- 
kennzeichnet, dass in der Homokaryontisierung (ii) ein mutagenes 
Agens eingesetzt wird. 

10 16.Verfahren nach Anspruch 15, dadurch gekennzeichnet, dass als mu- 
tagenes Agens N-Methyl-N'-nitro-nitrosoguanidin (MNNG), UV- 
Strahlung Oder Rontgenstrahlung eingesetzt wird. 

17. Verfahren nach einem der vorhergehenden Anspriiche, dadurch ge- 
kennzeichnet, dass die Selektion durch Markierung und/oder Auswahl 

15 der einkernigen Zellen erfolgt. 

18. Verfahren nach einem der vorhergehenden Anspriiche 1-17, dadurch 
gekennzeichnet, dass in der Selektion 5-Carbon-5-deazariboflavin 
(darf) und Hygromycin (hyg) oder 5-Fluororotat (FOA) und Uracil und 
Hygromycin eingesetzt werden. 

20 19.Verfahren nach einem der Anspriiche 3 bis 18, dadurch gekenn- 
zeichnet, dass der in der Transformation (i) eingesetzte Vector geneti- 
sche Informationen zur Herstellung von Carotinoiden oder deren Vor- 
stufen enthalt. 

20.Verfahren nach einem der Anspriiche 3 bis 19, dadurch gekenn- 
25 zeichnet, dass der in der Transformation (i) eingesetzte Vector geneti- 
sche Informationen zur Herstellung von Carotinen oder Xanthophyllen 
enthalt. 
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21.Verfahren nach einem der Anspruche 3 bis 20, dadurch gekenn- 
zeichnet, dass der in der Transformation (i) eingesetzte Vector geneti- 
sche lnformationen zur Hersteliung von Astaxanthin, Zeaxanthin, Echi- 
nenon, p-Cryptoxanthin, Andonixanthin, Adonirubin, Canthaxanthin, 
5 3-Hydroxyechinenon, 3-Hydroxyechinenon, Lycopin, p-Carotin, a- 
Carotin, Lutein, Phytofluen, Bixin oder Phytoen enthalt. 



10 



22.Verfahren zur Bereitstellung mindestens eines hochreinen Carotinoids 
und eines Nahrungsmittels, enthaltend Carotinoide-produzierende Or- 
ganismen und mindestens das eine Carotinoid, umfassend nach der 
15 Kultivierung von Carotinoide-produzierenden Organismen der Gattung 
Blakeslea die Schritte 

I) Abtrennung der Biomasse, 

iA) ggf. Waschen der Biomasse mit einem Carotinoide 
nicht losenden Losungsmittel, insbesondere Wasser, 
20 IB) Sterilisation und Zellaufschlufc der Biomasse, 

IC) ggf. Trocknung und/oder homogene Verteilung und 

II) partielle Extraktion der Carotinoide aus der aufgeschlosse- 
nen Biomasse mittels eines Carotinoide ISsenden L6sungs- 
mittels und Trennung des Losungsmittels von der Biomasse, 

25 HA) 
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1) Entfernung von L6semittelresten aus der Carotinoid- 
haltigen Biomasse, 

2) ggf. homogene Suspension der Biomasse mit einem 
Biomasse-Feststoffgehalt > 10 

5 3) Trocknung der Biomasse bzw. Suspension zur Her- 

stellung des Nahrungsmittels, 

IIB) 

1) Kristallisation der Carotinoide aus dem verwendeten 
LSsungsmittel und Isolierung der Carotinoid-Kristalle, 
10 insbesondere durch Filtration. 

23. Verfahren nach Anspruch 22, dadurch gekennzeichnet, dass das 
mindestens eine Carotinoid aus der Gruppe bestehend aus Carotinen 
und Xanthophyllen ausgewahlt ist. 

24. Verfahren nach Anspruch 22 oder 23, dadurch gekennzeichnet, dass 
15 das mindestens eine Carotinoid aus der Gruppe bestehend aus Asta- 

xanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, Andonixanthin, Ado- 
nirubin, Canthaxanthin, 3-Hydroxyechinenon, 3-Hydroxyechinenon, 
Lycopin, p-Carotin, Lutein, Phytofluen, Bixin und Phytoen ausgewahlt 
ist. 

20 25.Verfahren nach einem der AnsprQche 22 bis 24, dadurch gekenn- 
zeichnet, dass das mindestens eine Carotinoid Astaxanthin, Zea- 
xanthin, Bixin oder Phytoen ist. 

26. Verfahren nach einem der AnsprQche 22-25, dadurch gekennzeich- 
net, dass die Sterilisation und der Zellaufschluli mittels Wasserdampf 
25 oder Mikrowellenstrahlung durchgefQhrt werden. 



27. Verfahren nach einem der AnsprQche 22-26, dadurch gekennzeich- 
net, dass die Extraktion der Carotinoide aus der Biomasse mittels Me- 
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thylenchlorid oder Qberkritischem Kohlendioxid Oder Tetrahydrofuran 
durchgefuhrt wird. 

28. Verfahren nach Anspruch 27, dadurch gekennzeichnet, dass die im 
Qberkritischen Kohlendioxid gelosten Carotinoide direkt isoliert werden 

5 oder in Methylenchlorid aufgenommen werden. 

29. Verfahren nach einem der Anspruche 22-28, dadurch gekennzeich- 
net, dass die Extraktion der Carotinoide aus der Biomasse ein oder 
ggf. mehrstufig erfolgt 

30. Verfahren nach einem der Anspruche 22-29, dadurch gekennzeich- 
10 net, dass die Entfemung von Losungsmitteln aus der Biomasse im 

Schritt IA1) mittels Wasserdampf-Destillation . 

31. Verfahren nach einem der Ansprtiche 22-30, dadurch gekennzeich- 
net, dass die Trocknung in Schritt 1 1 A3) mittels Spriihtrocknung oder 
Kontakttrocknung durchgefuhrt wird. 

15 32. Verfahren nach einem der vorhergehenden Anspruche, dadurch ge- 
kennzeichnet, dass die Kristallisation im Schritt IIB1) durch graduellen 
Losungsmittelaustausch gegen ein Carotinoide nicht ISsendes L6- 
sungsmittel erfolgt. 

33. Verfahren nach Anspruch 32, dadurch gekennzeichnet, dass der 
20 Austausch des verwendeten L6sungsmittels gegen Wasser oder einen 

niederen Alkohol, insbesondere Methanol erfolgt. 

34. Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass der 
gentechnisch veranderte Organismus der Gattung Blakeslea durch 
Transformation mit einem Vector, der eine Sequenz aus der Gruppe 

25 bestehend aus den SEQ ID NO: 37 - 51 und 62 aufweist, herstellbar 
1st 
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35.Verfahren zur Herstellung eines Nahrungsmittels enthaltend Organis- 
men der Gattung Blakeslea und mindestens ein Carotinoid, umfassend 
nach der Kultivierung von Carotinoide-produzierenden Organismen der 
Gattung Blakeslea die Schritte 

5 I) Homogene Suspendierung der Feststoffe der Kulturbriihe 

und 



1 1 A) bei einem Biomasse-Feststoffgehalt der Kulturbriihe von > 2 
% 

10 1) ggf. Konzentration der KulturbrQhe auf einen Fest- 

stoffgehalt < 50 % und 
2) Trocknung der Kulturbriihe zur Herstellung des Nah- 
rungsmittels 

oder 

15 

MB) bei einem Feststoffgehalt von < 2 % der Kulturbriihe, 

1) Konzentration der Kulturbriihe auf einen Feststoffge- 
halt > 2 % und < 50 % und 

2) Trocknung der Suspension zur Herstellung des Nah- 
20 rungsmittels, 

oder 



IIC) unabhangig vom Feststoffgehalt der Kulturbriihe, 
1) Abtrennung der Biomasse, 
25 2) ggf. Waschen der Biomasse mit Carotinoide nicht 16- 

senden Ldsungsmitteln, insbesondere Wasser, 

3) Sterilisation und Zellaufschluft, 

4) ggf. Trocknung und homogene Verteilung, 

5) partielle Extraktion der Carotinoide aus der Biomasse 
30 mittels eines Carotinoide KJsendes LSsungsmittels, 
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5a) Abtrennung der Carotinoid-haltigen Biomasse 
vom Carotinoid-haltigen Losungsmittel, 

5b) Entfernung von L6semittelresten aus der Bio- 
masse und 

5 5c) Trocknung der Biomasse zur Herstellung des 

Nahrungsmittels, 
6) Kristallisation der Carotinoide aus dem in 5a) verwen- 
deten Losungsmittel und Isolierung der Carotinoid- 
Kristalle, insbesondere durch Filtration. 

10 36.Verfahren nach Anspruch 35, dadurch gekennzeichnet, dass das 
mindestens eine Carotinoid aus der Gruppe bestehend aus Carotinen 
und Xanthophyllen ausgewahlt ist. 

37. Verfahren nach Anspruch 35 oder 36, dadurch gekennzeichnet, dass 
das mindestens eine Carotinoid aus der Gruppe bestehend aus Asta- 

15 xanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, Andonixanthin, Ado- 
nirubin, Canthaxanthin, 3-Hydroxyechinenon, 3'-Hydroxyechinenon, 
Lycopin, p-Carotin, Lutein, Bixin, Phytoen ausgewahlt ist. 

38. Verfahren nach einem der Anspriiche 35-37, dadurch gekennzeich- 
net, dass das mindestens eine Carotinoid Astaxanthin, Zeaxanthin, Bi- 

20 xin oder Phytoen ist. 

39. Verfahren nach einem der Anspriiche 35-38, dadurch gekennzeich- 
net, dass die Sterilisation und der ZellaufschluB im Schritt II3) mittels 
Wasserdampf oder Mikrowellenstrahlung durchgefuhrt wird. 

40. Verfahren nach einem der Anspriiche 35-39, dadurch gekennzeich- 
25 net, dass die Extraktion der Carotinoide aus der Biomasse im Schritt 

IIC5) mittels Methylenchlorid oder Oberkritischen Kohlendioxid 
durchgefuhrt wird. 



WO 2004/063359 



102 



PCT7EP2004/000099 



41. Verfahren nach Anspruch 40, dadurch gekennzeichnet, dass die im 
Uberkritischen Kohlendioxid gelosten Carotinoide direkt isoliert werden 
oder in Methylenchlorid aufgenommen werden.. 

42. Verfahren nach einem der AnsprQche 35-41, dadurch gekennzeich- 
5 net, dass die Extraktion der Carotinoide aus der Biomasse ein- oder 

ggf. mehrstufig erfolgt. 

43. Verfahren nach einem der AnsprOche 35-42, dadurch gekennzeich- 
net, dass die Entfernung von Lftsungsmitteln aus der Biomasse im 
Schritt IIC5b) mittels Wasserdampf-Destillation. 

10 44.Verfahren nach einem der AnsprOche 35-43, dadurch gekennzeich- 
net, dass die Trocknung in einem der Schritte IIA1), IIB2) oder IIC5c) 
mittels SprOhtrocknung oder Kontakt durchgefOhrt wird. 

45. Verfahren nach einem der Anspruche 35-44, dadurch gekennzeich- 
net, dass die Kristallisation im Schritt IIC6) durch graduellen L6- 

15 sungsmittelaustausch gegen ein Carotinoide nicht losendes LOsungs- 
mittel erfolgt. 

46. Verfahren nach Anspruch 45, dadurch gekennzeichnet, dass der 
Austausch des verwendeten Losungsmittels gegen Wasser oder einen 
niederen Alkohol, insbesondere Methanol erfolgt. 

20 47. Verfahren nach einem der AnsprOche 35-46, dadurch gekennzeich- 
net, dass der gentechnisch veranderte Organismus der Gattung Bla- 
keslea durch Transformation mit einem Vector, der eine Sequenz aus 
der Gruppe bestehend aus den SEQ ID NO: 37 - 51 und 62 aufweist, 
herstellbar ist. 



25 



48.Nahrungsmittel, insbesondere Tierfuttermittel herstellbar nach einem 
der Verfahren der Anspruche 1 bis 47. 
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49. Nahrungserganzungsmittel, insbesondere Tierfuttererganzungsmittel 
herstellbar nach einem der Verfahren derAnsprtiche 1 bis 47. 

50. Verfahren nach einem der AnsprQche 1-49 dadurch gekennzeichnet, 
dafi Nahrungsmittel und Tierfuttermittel aus einer Fermentation erhalt- 

5 iich sind. 

51. Verfahren nach einem der AnsprQche 1-49 dadurch gekennzeichnet, 
daft Nahrungserganzungsmittel und Tierfuttererganzungsmittel aus ei- 
ner Fermentation erhaltlich sind. 

52. Verfahren nach einem der AnsprQche 1-49 dadurch gekennzeichnet, 
10 dad mindestens zwei Produkte aus der Gruppe Nahrungsmittel, Nah- 
rungserganzungsmittel, Tierfuttermittel und Tierfuttererganzungsmittel 
aus einer Fermentation erhaltlich sind. 

53. Verwendung der nach einem der Verfahren der AnsprQche 1 bis 14 
erhaltlichen Carotinoide zur Herstellung von kosmetischen, pharma- 

15 zeutischen, dermatologischen Zubereitungen, Nahrungsmitteln, Nah- 
rungserganzungsmitteln, Tierfuttermittel oder Tierfuttererganzungsmit- 
tel. 



20 
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Fig. 1: Vektor pANsCosl 




Afoul (501 2) 
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Fig. 2: Vektor pBinAHyg 
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Fig. 3: Gels des Ergebnis einer PCR 

Spur 

1 2345 678 9 
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Fig. 4: Plasmid pBinAHygBTpyrG-SCO 



Not\ (93) 
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Fig. 5: Plasmid pBinAHygBTpTEFI-HPcrtZ 




Saf 1(8800) 
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Fig. 6: Plasmid pBinAHyg-BTpcarRA-HPcrtZ 



Atf 1(90) 
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Fig. 7: Plasmid pBinAHygBTpcarB-HPcrtZ 
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hph (8057-9976 fcp) 
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/^n 1(6789) 
Sra I (6791) 
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gpft promoter (6797-8783 bp) 
Aril (8374) 
&f 1(8600) 
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Fig. 8: Plasmid p-carRA-HPcrtZ-TAG-3'carA-IR 




T-DNMghtborder (9139-9300 bp) ISPTB (7848-8831 bp) 
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Fig. 9: Plasmid p-carRA-HPcrtZ-GCG-3'carA-IR 




WO 2004/063359 



10/24 



PCT/EP2004/000099 



Fig. 10: Plasmid pBinAHygBTpTEFI-EUcrtZ 
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Fig. 11: Plasmid pBinAHygBTpcarRA-EUcrtZ 
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Fig. 12: Plasmid pBinAHygBTpcarB-EUcrtZ 
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Fig. 14: Plasmid pBinAHyg-carRcrtZcarA 



T-DNA left border gpdA promoter 




T-DNA right border 
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Fig. 15: Plasmid pBinAHyg-BTpTEFI-NPcrtW 
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Fig. 16: Plasmid pBinAHyg_BTpcarRA_NPcrtW 




WO 2004/063359 



17/24 



PCT/EP2004/000099 



Fig. 17: Plasmid pBinAHyg-BTpcarB-NPcrtW 




WO 2004/063359 



18/24 



PCT/EP2004/000099 



Fig. 18: Plasmid pBinAHygBTpcarRA-HPcrtZ-BTpcarRA-NpucrtW 
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Fig. 19: Plasmid pBinAHygBTpcarRA-EUcrtZ-BTpcarRA-NpucrtW 
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Fig. 20: carB 




Blakeslea trispora carB . 

2981 bp 
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Fig. 21: CDS von carB 
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Fig. 22: Vektor pBinAHygAcarB 
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Fig. 23: HPLC Standard 
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Fig. 24: HPLC 

; Sequence File ' i C : \HPCHEM\2 VSEQtfENCE\ CAROTIN • S 
. Method ; Cr \HBCHEM\2\METHODS\ CAROTIN .M 

..Last changed .X1/XB^QQ3 

/ Carotinbide NucXeosll 100-7u "C18 .250*4 , 0mm 

. DAD1 A, St0=4SO^ORef=off (1B1ira.l\PROBE010:D) ] ~ 
\mAlM 
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<110> BASF AG 

<120> Verfahren zur Herstellung von Carotinoiden oder deren Vorstufen 
mittels gentechnisch veranderter Organismen der Gattung 
Blakeslea, mit deia Verfahren hergestellte Carotinoide oder deren 
Vorstufen und deren Verwendung 

<130> BASF/NAE877/03 

<160> 80 

<170> Patentln version 3.2 

<210> 1 

<211> 2160 

<212> DNA 

<213> Artificial 

<220> 

<223> Promotor 
<400> 1 

ctttcgacac tgaaatacgt cgagcctgct ccgcttggaa gcggcgagga gcctcgtcct 60 

gtcacaacta ccaacatgga gtacgataag ggccagttcc gccagctcat taagagccag 120 

ttcatgggcg ttggcatgat ggccgtcatg catctgtact tcaagtacac caacgctctt 180 

ctgatccagt cgatcatccg ctgaaggcgc tttcgaatct ggttaagatc cacgtcttcg 240 

ggaagccagc gactggtgac ctccagcgtc cctttaaggc tgccaacagc tttctcagcc 300 

agggccagcc caagaccgac aaggcctccc tccagaacgc cgagaagaac tggaggggtg 360 

gtgtcaagga ggagtaagct ccttattgaa gtcggaggac ggagcggtgt caagaggata 420 

ttcttcgact ctgtattata gataagatga tgaggaattg gaggtagcat agcttcattt 480 



ggatttgctt tccaggctga gactctagct tggagcatag agggtccttt ggctttcaat 540 
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attctcaagt atctcgagtt tgaacttatt ccctgtgaac cttttattca ccaatgagca . 600 

ttggaatgaa catgaatctg aggactgcaa tcgccatgag gttttcgaaa tacatccgga * 660 

tgtcgaaggc ttggggcacc tgcgttggtt gaatttagaa cgtggcacta ttgatcatcc 720 

gatagctctg caaagggcgt tgcacaatgc aagtcaaacg ttgctagcag ttccaggtgg 780 

aatgttatga tgagcattgt attaaatcag gagatatagc atgatctcta gttagctcac 840 

cacaaaagtc agacggcgta accaaaagtc acacaacaca agctgtaagg atttcggcac 900 

ggctacggaa gacggagaag ccaccttcag tggactcgag taccatttaa ttctatttgt 960 

gtttgatcga gacctaatac agcccctaca acgaccatca aagtcgtata gctaccagtg 1020 

aggaagtgga ctcaaatcga cttcagcaac atctcctgga taaactttaa gcctaaacta 1080 

- tacagaataa gataggtgga gagcttatac cgagctccca aatctgtcca gatcatggtt 1140 

gaccggtgcc tggatcttcc tatagaatca tccttattcg ttgacctagc tgattctgga 1200 

gtgacccaga gggtcatgac ttgagcctaa aatccgccgc ctccaccatt tgtagaaaaa 1260 

tgtgacgaac tcgtgagctc tgtacagtga ccggtgactc tttctggcat gcggagagac 1320 

ggacggacgc agagagaagg gctgagtaat aagccactgg ccagacagct ctggcggctc 1380 

tgaggtgcag tggatgatta ttaatccggg accggccgcc cctccgcccc gaagtggaaa 1440 

ggctggtgtg cccctcgttg accaagaatc tattgcatca tcggagaata tggagcttca 1500 

tcgaatcacc ggcagtaagfc gaaggagaat gtgaagccag gggtgtatag ccgtcggcga 1560 

aatagcatgc cattaaccta ggtacagaag tccaattgct tccgatctgg taaaagattc 1620 

acgagatagt accttctccg aagtaggtag agcgagtacc cggcgcgtaa gctccctaat 1680 

tggcccatcc ggcatctgta gggcgtccaa atatcgtgcc tctcctgctt tgcccggtgt 1740 

atgaaaccgg aaaggccgct caggagctgg ccagcggcgc agaccgggaa cacaagctgg 1800 
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cagtcgaccc atccggtgct ctgcactcga cctgctgagg tccctcagtc cctggtaggc 1860 

agctttgccc cgtctgtccg cccggtgtgt cggcggggtt gacaaggtcg ttgcgtcagt 1920 

ccaacatttg ttgccatatt ttcctgctct ccccaccagc tgctcttttc ttttctcttt 1980 

cttttcccat cttcagtata ttcatcttcc catccaagaa cctttatttc ccctaagtaa 2040 

gtactttgct acatccatac tccatccttc ccatccctta ttcctttgaa cctttcagtt 2100 

cgagctttcc cacttcatcg cagcttgact aacagctacc ccgcttgagc agacatcacc 2160 



<210> 2 

<211> 774 

<212> DNA 

<213> Artificial 

<220> 

<223> Terminator 



<220> 

<221> misc — feature 

<222> (267) . . (267) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (475) . - (475) 

<223> n is a, c, g, or t 

<220> 

<221> misc — feature 

<222> (566) . . (566) 

<223> n is a, c, g, or t 

<400> 2 

cgatccactt aacgttactg aaatcatcaa acagcttgac gaatctggat ataagatcgt 60 
tggtgtcgat gtcagctccg gagttgagac aaatggtgtt caggatctcg ataagatacg 120 
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ttcatttgtc caagcagcaa agagtgcctt ctagtgattt aatagctcca tgtcaacaag 
aataaaacgc gttttcgggt ttacctcttc cagatacagc tcatctgcaa tgcattaatg 
cattgactgc aacctagtaa cgccttncag gctccggcga agagaagaat agcttagcag 
agctattttc attttcggga gacgagatca agcagatcaa cggtcgtcaa gagacctacg 
agactgagga atccgctctt ggctccacgc gactatatat ttgtctctaa tfcgtactttg 
acatgctcct cttctttact ctgatagctt gactatgaaa attccgtcac cagcncctgg 
gttcgcaaag ataattgcat gtttcttcct tgaactctca agcctacagg acacacattc 
-atcgtaggta taaacctcga aatcanttcc tactaagatg gtatacaata gtaaccatgc 
atggttgcct agtgaatgct ccgtaacacc caatacgccg gccgaaactt ttttacaact 
ctcctatgag tcgtttaccc agaatgcaca ggtacacttg tttagaggta atccttcttt 
ctagctagaa gtcctcgtgt actgtgtaag cgcccactcc acatctccac tcga 

<210> 3 

<211> 15739 

<212> DNA 

<213> Artificial 

<220> 

<223> Vector 



<220> 

<221> misc_feature 

<222> (3471) . . (3471) 

<223> n is a, c, g, or t 

<220> 

<2 2 1> misc_f eature 

<222> (3679) . . (3679) 

<223> n is a, c, g, or t 



180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

774 



WO 2004/063359 PCT/EP2004/000099 

5/357 

<220> 

<221> misc_feature 
. <222> (3770) . . (3770) 

<223> n is a, c, g, or t 

<400> 3 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaiagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 
tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca . 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 
tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 
tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 
caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 
cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt gg^ctcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 
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ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta „ 2280 
ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 
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tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 
tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 
tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 
atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 
cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 
gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 
tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 
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atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3 840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caagcttggc gtaatcatgg tcatagctgt 4020 

ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 4080 

agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 4140 

tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4200 

cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca accgattgag 4260 

ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca ccgtcaccga 4320 

cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta ccattagcaa 4380 

ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta gcgacagaat 4440 

caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc 4500 

ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg 4560 

aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca ccaccctcag 4620 

agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgatctagt 4680 

aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttttct 4740 

atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct cataaataac 4800 
gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa ttatatgata 4860 
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atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca aatgtttgaa 4920 

cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga acgcagcaag 4980 

atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt gatgtggacg 5040 

ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc cgttgctgtc 5100 

4 

gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc gaagaactcc 5160 

agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac gattccgaag 5220 

cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag gttgggcgtc 5280 

gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat 5340 

agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag 5400 

cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc 5460 

ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca 5520 

tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg tcgggcatgc 5580 

gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat 5640 

catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg 5700 

cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag 5760 

ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca 5820 
cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc 5880 
aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agttcattca 5940 
gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga 6000 
acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagcctct 6060 
ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc 6120 
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cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt ggataccgag 6180 

gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagtg 6240 

accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa 6300 

actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca gttccaaacg 6360 

taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt aattctccgc 6420 

tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg acaggatata 6480 

ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat ttaaaagggc 6540 

gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttccccaga 6600 

tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat ccgacagcgc 6660 

gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca gaatgccata 6720 

gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca gcaccggcat 6780 

aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga tcaggggtat 6840 

gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa cgcgcggatt 6900 

ctttatcact gataagttgg tggacatatt atgtfctatca gtgataaagt gtcaagcatg 6960 

acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa cgaggtcggc 7020 

gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca gccggcgctt 7080 

tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc catgctggcg 7140 

gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg 7200 

aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg catccatgcc 7260 

ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg cttcctctgc 7320 

gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag ctacttcact 7380 
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• gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc 7440 

gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt cgacgaagcc 7500 

ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt ggcgaaaagg 7560 

aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc aggaccgctg 7620 

ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct ccccctttcc 7680 

accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc cctagcgtcc 7740 

aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc 7800 

tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7860 

cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7920 . 

gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7980 

gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 8040 

gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 8100 

ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgcttttcc 8160 

gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc atcctttttc 8220 

gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg tatccaacgg 8280 

cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc cttcttcact 8340 

gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg ctggccggct 8400 
accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag 8460 
ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat tgaggaaaag 8520 
gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca gggctacaaa 8580 
atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg 8640 
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ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac ggcgcggttc 8700 

ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga cgagcttggc 8760 

aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta gccgctaaaa 8820 

cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga 8880 

cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc gcctttgcga 8940 

cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc cctgcaaacg . 9000 

cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt tgtggatacc 9060 

tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact tgaggggccg 9120 

actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg gcgacgtgga 9180 

gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc ccacagatga 9240 

tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc gcgactactg 9300 

acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga tgaggggcgc 9360 

acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc aagggtttcc 9420 

gcccgttttt cggccaccgc taacctgtct tttaacctgo ttttaaacca atatttataa 9480 

accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg aaggggggtg 9540 

cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc ccaggggctg 9600 

cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt ccttgccatt 9660 

gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc cggaagcatt 9720 

gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag tgagggcggc 9780 

ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga cttcatggcg 9840 

gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc cgtgctcgtg 9900 
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ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt ataccgaggt 9960 
atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat ttaaaaagct 10020 
accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat attgacaata 10080 
ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga tttcaggggg 10140 
caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca taaaaacttg 10200 
catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt ctatcataat 10260 
tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc gatgactttg 10320 
tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg tgccaggtgc 10380 
tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct gattacgtgc 10440 
agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca tatcaccacg 10500 
tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg ttcaccgaat 10560 
acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca gcgctggcgc 10620 
gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat gacgtcactg 10680 
cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga cgtaaaatcg 10740 
tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca ttcatggcca 10800 
tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac tgcagttgcc 10860 
atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt ttgccgttac 10920 
gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa gccactggag 10980 
cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc cataattgtg 11040 
gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac aactttgaaa 11100 
aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg gagttcgtct 11160 
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tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa ggaaataata 11220 

aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat accgctgcgt 11280 

aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa 11340 

cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg tggaacggga 11400 

aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga 11460 

acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc tttgctcgga 11520 

agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg agtgcatcag 11580 

gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag acagccgctt 11640 

agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg aaaactggga 11700 

agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga cggaaaagcc 11760 

cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct ttgtgaaaga 11820 

tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca agtggtatga 11880 

cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt atgtcgagct 11940 

attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt atattttact 12000 

ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag caggagcgca 12060 

ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc aagtatttgg 12120 

gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac gagaaggacg 12180 

gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg gacaccaagg 12240 
caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc ggggcaatcc 12300 
cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa gaactgatcg 12360 
acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc atgcgtgcgc 12420 
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cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc aagatcgagc 12480 
gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc gtggagcgtt 12540 
cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc gacacgcgag 12600 
gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa caggtcagcg 12660 
aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa atgcagcttt 12720 
ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac gacacggccc 12780 
gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg caaaacaagg 12840 
tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag ctgcgggccg 12900 
acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc cctatcggcg 12960 
agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg atcaatggcc 13020 
ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg atgggcttca 13080 
cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc cgcgtcctgg 13140 
accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc gtcgtgctgt 13200 
ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg tcgccgacgg 13260 
cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc aagctggaaa 13320 
ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc gagcaggtcg 13380 
gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg gtcaatgatg 13440 
acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg ggttcagcag 13500 
ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact tgcttcgctc 13560 
agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag gattaaaatt 13620 
gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc aggatttccg 13680 
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cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg tttacgagca 13740 
cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg tggcattcgg 13800 
cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg acggccccaa 13860 
ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc gaggccgagg 13920 
ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga tgatcgtccg 13980 
acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac ttaatatttc 14040 
gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg tcgcggcgac 14100 
ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc taggtagccc 14160 
gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg cgctgttggt 14220 
gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg cgggggcggt 14280 
ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc ctctgctcac 14340 
ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag ctttagtgtt 14400 
tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt ggctcggcct 14460 
gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac tcgaacctac 14520 
agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc cggggatgca 14580 
tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag caatggatag 14640 
gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc ttcctcagcg 14700 
gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca gcctgtcacg 14760 
gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg agatgatatt 14820 
tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct ccgcgagatc 14880 
atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc ggtaacatga 14940 
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gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact gatgggctgc 15000 

ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg ctggctggtg 15060 

gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac acattgcgga 15120 

cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa cagctgattg 15180 

cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt ttgccccagc 15240 

aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat aaatcaaaag 15300 

aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 15360 

acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 15420 

aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 15480 

ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 15540 

aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg ggaagggcga 15600 

tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 15660 

ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa 15720 

ttcgagctcg gtacccggg 15739 
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<400> 4 

agcttgcatg cctgcaggtc gagtggagat gtggagtggg cgcttacaca gtacacgagg 60 

acttctagct agaaagaagg attacctcta aacaagtgta cctgtgcatt ctgggtaaac 120 

gactcatagg agagttgtaa aaaagtttcg gccggcgtat tgggtgttac ggagcattca 180 

ctaggcaacc atgcatggtt actattgtat accatcttag taggaantga tttcgaggtt 240 

tatacctacg atgaatgtgt gtcctgtagg cttgagagtt caaggaagaa acatgcaatt 300 

atctttgcga acccaggngc tggtgacgga attttcatag tcaagctatc agagtaaaga 360 

agaggagcat gtcaaagtac aattagagac aaatatatag tcgcgtggag ccaagagcgg 420 

attcctcagt ctcgtaggtc tcttgacgac cgttgatctg cttgatctcg tctcccgaaa 480 

atgaaaatag ctctgctaag ctattcttct cttcgccgga gcctgnaagg cgttactagg 540 

ttgcagtcaa tgcattaatg cattgcagat gagctgtatc tggaagaggt aaacccgaaa 600 
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acgcgtttta ttcttgttga catggagcta ttaaatcact agaaggcact ctttgctgct 660 

tggacaaatg aacgtatctt atcgagatcc tgaacaccat ttgtctcaac tccggagctg 720 

acatcgacac caacgatctt atatccagat tcgtcaagct gtttgatgat ttcagtaacg 780 

ttaagtggat cgatcccgcg gtcggcatct actctattcc tttgccctcg gacgagtgct 840 

ggggcgtcgg tttccactat cggcgagtac ttctacacag ccatcggtcc agacggccgc 900 

gcttctgcgg gcgatttgtg tacgcccgac agtcccggct ccggatcgga cgattgcgtc 960 

gcatcgaccc tgcgcccaag ctgcatcatc gaaattgccg tcaaccaagc tctgatagag 1020 

ttggtcaaga ccaatgcgga gcatatacgc ccggagccgc ggcgatcctg caagctccgg 1080 

atgcctccgc tcgaagtagc gcgtctgctg ctccatacaa gccaaccacg gcctccagaa 1140 

gaagatgttg gcgacctcgt attgggaatc cccgaacatc gcctcgctcc agtcaatgac 1200 

cgctgttatg cggccattgt ccgtcaggac attgttggag ccgaaatccg cgtgcacgag 1260 

gtgccggact tcggggcagt cctcggccca aagcatcagc tcatcgagag cctgcgcgac 1320 

ggacgcactg acggtgtcgt ccatcacagt ttgccagtga tacacatggg gatcagcaat 1380 

cgcgcatatg aaatcacgcc atgtagtgta ttgaccgatt ccttgcggtc cgaatgggcc 1440 

gaacccgctc gtctggctaa gatcggccgc agcgatcgca tccatggcct ccgcgaccgg 1500 

ctgcagaaca gcgggcagtt cggtttcagg caggtcttgc aacgtgacac cctgtgcacg 1560 

gcgggagatg caataggtca ggctctcgct gaattcccca atgtcaagca cttccggaat 1620 

cgggagcgcg gccgatgcaa agtgccgata aacataacga tctttgtaga aaccatcggc 1680 

gcagctattt acccgcagga catatccacg ccctcctaca tcgaagctga aagcacgaga 1740 

ttcttcgccc tccgagagct gcatcaggtc ggagacgctg tcgaactttt cgatcagaaa 1800 

cttctcgaca gacgtcgcgg tgagttcagg catggtgatg tctgctcaag cggggtagct 1860 
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gttagtcaag ctgcgatgaa gtgggaaagc tcgaactgaa aggttcaaag gaataaggga 1920 

tgggaaggat ggagtatgga tgtagcaaag tacttactta ggggaaataa aggttcttgg 1980 

atgggaagat gaatatactg aagatgggaa aagaaagaga aaagaaaaga gcagctggtg 2040 

gggagagcag gaaaatatgg caacaaatgt tggactgacg caacgacctt gtcaaccccg 2100 

ccgacacacc gggcggacag acggggcaaa gctgcctacc agggactgag ggacctcagc 2160 

aggtcgagtg cagagcaccg gatgggtcga ctgccagctt gtgttcccgg tctgcgccgc 2220 

tggccagctc ctgagcggcc tttccggttt catacaccgg gcaaagcagg agaggcacga 2280 

tatttggacg ccctacagat gccggatggg ccaattaggg agcttacgcg ccgggtactc 2340 

gctctaccta cttcggagaa ggtactatct cgtgaatctt ttaccagatc ggaagcaatt 2400 

ggacttctgt acctaggtta atggcatgct atttcgccga cggctataca cccctggctt 2460 

cacattctcc ttcgcttact gccggtgatt cgatgaagct ccatattctc cgatgatgca 2520 

atagattctt ggtcaacgag gggcacacca gcctttccac ttcggggcgg aggggcggcc 2580 

ggtcccggat taataatcat ccactgcacc tcagagccgc cagagctgtc tggccagtgg 2640 

cttattactc agcccttctc tctgcgtccg tccgtctctc cgcatgccag aaagagtcac 2700 

cggtcactgt acagagctca cgagttcgtc acatttttct acaaatggtg gaggcggcgg 2760 

attttaggct caagtcatga ccctctgggt cactccagaa tcagctaggt caacgaataa 2820 

ggatgattct ataggaagat ccaggcaccg gtcaaccatg atctggacag atttgggagc 2880 

tcggtataag ctctccacct atcttattct gtatagttta ggcttaaagt ttatccagga 2940 
gatgttgctg aagtcgattt gagtccactt cctcactggt agctatacga ctttgatggt 3000 
cgttgtaggg gctgtattag gtctcgatca aacacaaata gaattaaatg gtactcgagt 3060 
ccactgaagg tggcttctcc gtcttccgta gccgtgccga aatccttaca gcttgtgttg 3120 
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tgtgactttt ggttacgccg tctgactttt gtggtgagct aactagagat catgctatat 3180 

ctcctgattt aatacaatgc tcatcataac attccacctg gaactgctag caacgtttga 3240 

cttgcattgt gcaacgccct ttgcagagct atcggatgat caatagtgcc acgttctaaa 3300 

ttcaaccaac gcaggtgccc caagccttcg acatccggat gtatttcgaa aacctcatgg 3360 

cgattgcagt cctcagattc atgttcattc caatgctcat tggtgaataa aaggttcaca 3420 

gggaataagt tcaaactcga gatacttgag aatattgaaa gccaaaggac cctctatgct 3480 

ccaagctaga gtctcagcct ggaaagcaaa tccaaatgaa gctatgctac ctccaattcc 3540 

tcatcatctt atctataata cagagtcgaa gaatatcctc ttgacaccgc tccgtcctcc 3600 

gacttcaata aggagcttac tcctccttga caccacccct ccagttcttc tcggcgttct 3660 

ggagggaggc cttgtcggtc ttgggctggc cctggctgag aaagctgttg gcagccttaa 3720 

agggacgctg gaggtcacca gtcgctggct tcccgaagac gtggatctta accagattcg 3780 

aaagcgcctt cagcggatga tcgactggat cagaagagcg ttggtgtact tgaagtacag 3840 

atgcatgacg gccatcatgc caacgcccat gaactggctc ttaatgagct ggcggaactg 3900 

gcccttatcg tactccatgt tggtagttgt gacaggacga ggctcctcgc cgcttccaag 3960 

cggagcaggc tcgacgtatt tcagtgtcga aagatctgat caagagacag gatgaggatc 4020 

gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt gggtggagag 4080 

gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg ccgtgttccg 4140 
gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg gtgccctgaa 4200 
tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg ttccttgcgc 4260 
agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc 4320 
ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca tcatggctga 4380 
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tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc accaagcgaa 4440 

acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc aggatgatct 4500 

ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca aggcgcgcat 4560 

gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga atatcatggt 4620 

ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta 4680 

tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg aatgggctga 4740 

ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg 4800 

ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga ccaagcgacg 4860 

cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 4920 

ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 4980 

ttcttcgccc accccgggct cgatcccctc gcgagttggt tcagctgctg cctgaggctg 5040 
gacgacctcg cggagttcta ccggcagtgc aaatccgtcg gcatccagga aaccagcagc 5100 
ggctatccgc gcatccatgc ccccgaactg caggagtggg gaggcacgat ggccgctttg 5160 
gtccggatct ttgtgaagga accttacttc tgtggtgtga cataattgga caaactacct 5220 
acagagattt aaagctctaa ggtaaatata aaatttttaa gtgtataatg tgttaaacta 52 80 
ctgattctaa ttgtttgtgt attttagatt ccaacctatg gaactgatga atgggagcag 5340 
tggtggaatg cctttaatga ggaaaacctg ttttgctcag aagaaatgcc atctagtgat 5400 
gatgaggcta ctgctgactc tcaacattct actcctccaa aaaagaagag aaaggtagaa 5460 
gaccccaagg actttccttc agaattgcta agttttttga gtcatgctgt gtttagtaat 5520 
agaactcttg cttgctttgc tatttacacc acaaaggaaa aagctgcact gctatacaag 5580 
aaaattatgg aaaaatattc tgtaaccttt ataagtaggc ataacagtta taatcataac 5640 
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atactgtttt ttcttactcc acacaggcat agagtgtctg ctattaataa ctatgctcaa 5700 

aaattgtgta cctttagctt tttaatttgt aaaggggtta ataaggaata tttgatgtat 5760 

agtgccttga ctagagatca taatcagcca taccacattt gtagaggttt tacttgcttt 5820 

aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt 5880 

taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 5940 

aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 6000 

ttatcatgtc tggatctgac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct 6060 

aggctggcgg ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg 6120 

aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt 6180 

ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgctc ttccgcttcc tcgctcactg 6240 

actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 6300 

tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 6360 

aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 6420 

gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 6480 

gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 6540 

tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 6600 

ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 6660 

ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 6720 

tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 6780 

tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 6840 
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ctacactaga aggacaghat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 6900 

aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 6960 

ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 7020 

tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 7080 

atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 7140 

aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 7200 

ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 7260 

tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 7320 

ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 7380 

tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 7440 

aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctgcag gcatcgtggt 7500 

gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 7560 

tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 7620 

cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 7680 

tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 7740 

ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaacac gggataatac 7800 

cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 7860 

actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 7920 

ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 7980 

aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 8040 

ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 8100 
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atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 8160 

tgacgtctaa gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag 8220 

gccctttcgt cttcaagaat tcgcggccgc aattaaccct cactaaagga tccctatagt 8280 

gagtcgtatt atgcggccgc gaattctcat gtttgaccgc ttatcatcga taagctctgc 8340 

tttttgttga cttccattgt tcattccacg gacaaaaaca gagaaaggaa acgacagagg 8400 

ccaaaaagct cgctttcagc acctgtcgtt tcctttcttt tcagagggta ttttaaataa 8460 

aaacattaag ttatgacgaa gaagaacgga aacgccttaa accggaaaat tttcataaat 8520 

agcgaaaacc cgcgaggtcg ccgccccgta acaaggcgga tcgccggaaa ggacccgcaa 8580 

atgataataa ttatcaattg catactatcg acggcactgc tgccagataa caccaccggg 8640 

gaaacattcc atcatgatgg ccgtgcggac ataggaagcc agttcatcca tcgctttctt 8700 

gtctgctgcc atttgctttg tgacatccag cgccgcacat tcagcagcgt ttttcagcgc 8760 

gttttcgatc aacgtttcaa tgttggtatc aacaccaggt ttaactttga acttatcggc 8820 

actgacggtt accttgttct gcgctggctc atcacgcagg ataccaaggc tgatgttgta 8880 

gatattggtc accggctgag ggttttcgat tgccgctgcg tggatagcac catttgcgat 8940 

caggcngtcc ttgatgaatg acactccatt gcgaataagt tcgaaggaga cggtgtcacg 9000 

aatgcgctgg tccagctcgg tcgattgcct tttgtgcagc agaggtatca atctcaacgc 9060 

caaggctcat cgaagcgcaa tattgctgct caccaaaacg cgtattgacc aggtgttcaa 9120 

cggcaaattt ctgcccttct gatgtcagaa aggcaaagtg attttctttc tggtattcag 9180 

ttgctgtgtg tcggtttcag caaaaccaag ctcgcgcaat tcggctgtgc agatttagaa 9240 

ggcagatcac cagacagcaa cggccaacgg aaaacagcgc atacagaaca tccgtcgccg 93 00 

cgccgacaac gtgataattt ttatgaccca tgatttattt ccttttagac gtgagcctgt 9360 
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cgcacagcaa agccgccgaa agttcctcga agctagcttc agacgtgtct agatacgtct 9420 

gctttttgtt gacttccatt gttcattcca cggacaaaaa cagagaaagg aaacgacaga 9480 

ggccaaaaag ctcgctttca gcacctgtcg tttcctttct tttcagaggg tattttaaat 9540 

aaaaacatta agttatgacg aagaagaacg gaaacgcctt aaaccggaaa attttcataa 9600 

atagcgaaaa cccgcgaggt cgccgccccg taacaaggcg gatcgccgga aaggacccgc 9660 

aaatgataat aattatcaat tgcatactat cgacggcact gctgccagat aacaccaccg 9720 

gggaaacatt ccatcatgat ggccgtgcgg acataggaag ccagttcatc catcgctttc 9780 

ttgtctgctg ccatttgctt tgtgacatcc agcgccgcac attcagcagc gtttttcagc 9840 

gcgttttcga tcaacgtttc aatgttggta tcaacaccag gtttaacttt gaacttatcg 9900 

gcactgacgg ttaccttgtt ctgcgctggc tcatcacgca ggataccaag gctgatgttg 9960 

tagatattgg tcaccggctg agggttttcg attgccgctg cgtggatagc accatttgcg 10020 

atcaggcngt ccttgatgaa tgacactcca ttgcgaataa gttcgaagga gacggtgtca 10080 

cgaatgcgct ggtccagctc ggtcgattgc cttttgtgca gcagaggtat caatctcaac 10140 

gccaaggctc atcgaagcgc aatattgctg ctcaccaaaa cgcgtattga ccaggtgttc 10200 

aacggcaaat ttctgccctt ctgatgtcag aaaggcaaag tgattttctt tctggtattc 10260 

agttgctgtg tgtcggtttc agcaaaacca agctcgcgca attcggctgt gcagatttag 10320 

aaggcagatc accagacagc aacggccaac ggaaaacagc gcatacagaa catccgtcgc 10380 

cgcgccgaca acgtgataat ttttatgacc catgatttat ttccttttag acgtgagcct 10440 

gtcgcacagc aaagccgccg aaagttcctc gaccgatgcc cttgagagcc ttcaacccag 10500 

tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg actgtcttct 10560 

ttatcatgca actcgtagga caggtgccgg cagcgctctg ggtcattttc ggcgaggacc 10620 
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gctttcgctg gagcgcgacg atgatcggcc tgtcgcttgc ggtattcgga atcttgcacg 10680 

ccctcgctca agccttcgtc actggtcccg ccaccaaacg tttcggcgag aagcaggcca 10740 

ttatcgccgg catggcggcc gacgcgctgg gctacgtctt gctggcgttc gcgacgcgag 10800 

gctggatggc cttccccatt atgattcttc tcgcttccgg cggcatcggg atgcccgcgt 10860 

tgcaggccat gctgtccagg caggtagatg acgaccatca gggacagctt caaggatcgc 10920 

tcgcggctct taccagccta acttcgatca ttggaccgct gatcgtcacg gcgatttatg 10980 

ccgcctcggc gagcacatgg aacgggttgg catggattgt aggcgccgcc ctataccttg 11040 

tctgcctccc cgcgttgcgt cgcggtgcat ggagccgggc cacctcgacc tgaatggaag 11100 

ccggcggcac ctcgctaacg gattcaccac tccaagaatt ggagccaatc aattcttgcg 11160 

gagaactgtg aatgcgcaaa ccaacccttg gcagaacata tccatcgcgt ccgccatctc 11220 

cagcagccgc acgcggcgca tctcgggcag cgttgggtcc tgcagatccg gctgtggaat 11280 

gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc 11340 

atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc agcaggcaga 11400 

agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct aactccgccc 11460 

atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg actaattttt 11520 

tttatttatg cagaggccga ggccgcctcg gcctctgagc tattccagaa gtagtgagga 11580 

ggcttttttg gaggcctagg cttttgcaaa a 11611 

<210> 5 

<211> 21 

<212> DNA 

<213> Artificial 

<220> 
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<223> Primer 
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<400> 5 

cgatgtagga gggcgtggat a 21 

<210> 6 

<211> 21 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<400> 6 

gcttctgcgg gcgatttgtg t 21 



<210> 7 

<211> 20 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 7 

tgagaatatc accggaattg 20 



<210> 8 

<211> 21 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<400> 8 

agctcgacat actgttcttc c 



21 



WO 2004/063359 
9 

24 
,> DNA 
X3> Artificial 

<220> 

<223> Primer 
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<400> 9 

gtgaatggaa atcccatcgc tgtc 



24 



<210> 10 

<211> 24 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<400> 10 

agtgggtact ctaaaggcca tacc 



24 



<210> 11 

<211> 1771 

<212> DNA 

<213> Haematococcus pluvialis 



<220> 

<221> CDS 

<222> (166) . . (1155) 

<400> 11 

ggcacgagct tgcacgcaag tcagcgcgcg caagtcaaca cctgccggtc cacagcctca . 60 

aataataaag agctcaagcg tttgtgcgcc tcgacgtggc cagtctgcac tgccttgaac 120 

ccgcgagtct cccgccgcac tgactgccat agcacagcta gacga atg cag eta gca 177 

Met Gin Leu Ala 
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gcg aca gta atg ttg gag cag ctt acc gga age get gag gca etc aag 225 
Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala Glu Ala Leu Lys 
5 10 15 20 



gag aag gag aag gag gtt gca ggc age tct gac gtg ttg cgt aca tgg 273 
Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val Leu Arg Thr Trp 
25 30 35 

gcg acc cag tac teg ctt ccg tea gaa gag tea gac gcg gec cgc ccg 321 
Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser Asp Ala Ala Arg Pro 
40 45 50 

gga ctg aag aat gee tac aag cca cca cct tec gac aca aag ggc ate 3 69 

Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp Thr Lys Gly He 
55 60 65 



aca atg gcg eta cgt gtc ate ggc tec 
Thr Met Ala Leu Arg Val lie Gly Ser 
70 75 

gee att ttt caa ate aag ctt ccg acc 
Ala lie Phe Gin He Lys Leu Pro Thr 
85 90 

ctg ccc gtg tea gat gee aca get cag 
Leu Pro Val Ser Asp Ala Thr Ala Gin 
105 



tgg gee gca gtg ttc etc cac 417 
Trp Ala Ala Val Phe Leu His 
80 

tec ttg gac cag ctg cac tgg 465 
Ser Leu Asp Gin Leu His Trp 
'95 100 

ctg gtt age ggc acg age age 513 
Leu Val Ser Gly Thr Ser Ser 
110 115 



ctg etc gac ate gtc gta gta ttc ttt gtc ctg gag ttc ctg tac aca 561 

Leu Leu Asp He Val Val Val Phe Phe Val Leu Glu Phe Leu Tyr Thr 
120 125 130 

ggc ctt ttt ate acc acg cat gat get atg cat ggc acc ate gec atg 609 

Gly Leu Phe He Thr Thr His Asp Ala Met His Gly Thr He Ala Met 

135 140 145 



aga aac agg cag ctt aat gac ttc ttg ggc aga gta tgc ate tec ttg 
Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val Cys He Ser Leu 
150 155 160 



657 



753 



801 



849 



897 
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tac gcc tgg ttt gat tac aac atg ctg cac cgc aag cat tgg gag cac 705 

Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys His Trp Glu His 
165 170 175 180 

cac aac cac act ggc gag gtg ggc aag gac cct gac ttc cac agg gga 
His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp Phe His Arg Gly 
185 190 195 

aac cct ggc att gtg ccc tgg ttt gcc age ttc atg tec age tac atg 
Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met 
200 205 210 

teg atg tgg cag ttt* gcg cgc etc gca tgg tgg acg gtg gtc atg cag 
Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr Val Val Met Gin 
215 220 225 

ctg ctg ggt gcg cca atg gcg aac ctg ctg gtg ttc atg gcg gcc gcg 
Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala 
230 235 240 

ccc ate ctg tec gcc ttc cgc ttg ttc tac ttt ggc acg tac atg ccc 
Pro He Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Met Pro 
245 250 255 260 

cac aag cct gag cct ggc gcc gcg tea ggc tct tea cca gcc gtc atg 
His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser Pro Ala Val Met 
265 270 275 

aac tgg tgg aag teg cgc act age cag gcg tec gac ctg gtc age ttt 
Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp Leu Val Ser Phe 
280 285 290 

ctg ace tgc tac cac ttc gac ctg cac tgg gag cac cac cgc tgg ccc 
Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His His Arg Trp Pro 
295 300 305 

ttc gcc ccc tgg tgg gag ctg ccc aac tgc cgc cgc ctg tct ggc cga 1137 
Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg Leu Ser Gly Arg 
310 315 320 



945 



993 



1041 



1089 



ggt ctg gtt cct gcc tag ctggacacac tgcagtgggc cctgctgcca 
Gly Leu Val Pro Ala 



1185 
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325 

gctgggcatg caggttgtgg caggactggg tgaggtgaaa agctgcaggc gctgctgccg 1245 

gacacgctgc atgggctacc ctgtgtagct gccgccacta ggggaggggg tttgtagctg 1305 

tcgagcttgc cccatggatg aagctgtgta gtggtgcagg gagtacaccc acaggccaac 1365 

acccttgcag gagatgtctt gcgtcgggag gagtgttggg cagtgtagat gctatgattg 1425 

tatcttaatg ctgaagcctt taggggagcg acacttagtg ctgggcaggc aacgccctgc 1485 

aaggtgcagg cacaagctag gctggacgag gactcggtgg caggcaggtg aagaggtgcg 1545 

ggagggtggt gccacaccca ctgggcaaga ccatgctgca atgctggcgg tgtggcagtg 1605 

agagctgcgt gattaactgg gctatggatt gtttgagcag tctcacttat tctttgatat 1665 

agatactggt caggcaggtc aggagagtga gtatgaacaa gttgagaggt ggtgcgctgc 1725 

ccctgcgctt atgaagctgt aacaataaag tggttcaaaa aaaaaa 1771 



<210> 12 
<211> 329. 
<212> PRT 

<213> Haematococcus pluvialis 
<400> 12 

Met Gin Leu Ala Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala 
15 10 15 



Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val 
20 25 30 



Leu Arg Thr Trp Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser Asp 
35 40 45 
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Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp 
50 55 60 



Thr Lys Gly He Thr Met Ala Leu Arg Val He Gly Ser Trp Ala Ala 
65 



70 75 80 



Val Phe Leu His Ala He Phe Gin He Lys Leu Pro Thr Ser Leu Asp 
85 90 95 



Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser 
100 105 HO 



Gly Thr Ser Ser Leu Leu Asp He Val Val Val Phe Phe Val Leu Glu 
115 120 125 



Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp Ala Met His Gly 
130 135 140 

Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val 
145 150 155 160 



Cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys 
165 170 175 



His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp 
180 185 190 

Phe His Arg Gly Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe Met 
195 200 205 



Ser Ser Tyr Met Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp 
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Val Val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe 
225 230 235 240 



• Met Ala Ala Ala Pro lie Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly 
245 250 255 



Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser 
260 265 270 



Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp 
275 280 285 



Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His 
290 295 300 



His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg 
305 310 315 320 



• Leu Ser Gly Arg Gly Leu Val Pro Ala 
325 



<210> 13 

<211> 1662 

<212> DNA 

<213> Haematococcus pluvialis 



<220> 

<221> CDS 

<222> (168) - . (1130) 

<400> 13 
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cggggcaact caagaaattc aacagctgca agcgcgcccc agcctcacag cgccaagtga 60 

gctatcgacg tggttgtgag cgctcgacgt ggtccactga cgggcctgtg agcctctgcg 120 

ctccgtcctc tgccaaatct cgcgtcgggg cctgcctaag tcgaaga atg cac gtc 176- 

Met His Val 
1 

gca teg gca eta atg gtc gag cag aaa ggc agt gag gca get get tec 224 
Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala Ala Ala Ser 
5 10 15 

age cca gac gtc ttg aga gcg tgg gcg aca cag tat cac atg cca tec 272 
Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His Met Pro Ser 
20 25 30 35 

gag teg tea gac gca get cgt cct gcg eta aag cac gee tac aaa cct 320 
Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala Tyr Lys Pro 
40 45 50 

cca gca tct gac gee aag ggc ate acg atg gcg ctg acc ate att ggc 368 
Pro Ala Ser Asp Ala Lys Gly lie Thr Met Ala Leu Thr lie lie Gly 
55 60 65 

acc tgg acc gca gtg ttt tta cac gca ata ttt caa ate agg eta ccg 416 
Thr Trp Thr Ala Val Phe Leu His Ala lie Phe Gin lie Arg Leu Pro 
70 75 80 

aca tec atg gac cag ctt cac tgg ttg cct gtg tec gaa gee aca gee 464 
Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu Ala Thr Ala 
85 90 95 

cag ctt ttg ggc gga age age age eta ctg cac ate get gca gtc ttc 512 
Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His lie Ala Ala Val Phe 
100 105 110 115 

att gta ctt gag ttc ctg tac act ggt eta ttc ate acc aca cat gac 560 
lie Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe lie Thr Thr His Asp 
120 125 130 

gca atg cat ggc acc ata get ttg agg cac agg cag etc aat gat etc 608 
Ala Met His Gly Thr lie Ala Leu Arg His Arg Gin Leu Asn Asp Leu 
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135 140 145 

ctt ggc aac ate tgc ata tea ctg tac gec tgg ttt gac tac age atg 656 
Leu Gly Asn lie Cys lie Ser Leu Tyr Ala Trp Phe Asp Tyr Ser Met 
150 155 160 

ctg cat cgc aag cac tgg gag cac cac aac cat act ggc gaa gtg ggg 704 
Leu His Arg Lys His Trp Glu His His Asn His Thr Gly Glu Val Gly 
165 170 175 

aaa gac cct gac ttc cac aag gga aat ccc ggc ctt gtc ccc tgg ttc 752 
Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe 
180 185 190 195 

gec age ttc atg tec age tac atg tec ctg tgg cag ttt gee egg ctg 800 
Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe Ala Arg Leu 
200 205 210 

gca tgg tgg gca gtg gtg atg caa atg ctg ggg gcg ccc atg gca aat 848 
Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala. Pro Met Ala Asn 
215 220 225 

etc eta gtc ttc atg get gca gee cca ate ttg tea gca ttc cgc etc 896 
Leu Leu Val Phe Met Ala Ala Ala Pro lie Leu Ser Ala Phe Arg Leu 
230 235 240 

ttc tac ttc ggc act tac ctg cca cac aag cct gag cca ggc cct gca 944 
Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala 
245 250 255 

gca ggc tct cag gtg atg gee tgg ttc agg gee aag aca agt gag gca 992 
Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr Ser Glu Ala 
260 265 270 275 

tct gat gtg atg agt ttc ctg aca tgc tac cac ttt gac ctg cac tgg 1040 
Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp 
280 285 290 



gag cac cac agg tgg ccc ttt gee ccc tgg tgg cag ctg ccc cac tgc 
Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu Pro His Cys 
295 300 305 



1088 
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cgc cgc ctg tec ggg cgt ggc ctg gtg cct gcc ttg gca tga 1130 
Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala 
310 315 320 

cctggtccct ccgctggtga cccagcgtct gcacaagagt gtcatgetac. agggtgctgc 1190 

ggccagtggc agcgcagtgc actctcagcc tgtatggggc taccgctgtg ccactgagca 1250 

ctgggcatgc cactgagcac tgggcgtgct actgagcaat gggcgtgcta ctgagcaatg 1310 

ggcgtgctac tgacaatggg cgtgctactg gggtctggca gtggctagga tggagtttga 1370 

tgcattcagt agcggtggcc aacgtcatgt ggatggtgga agtgctgagg ggtttaggca 1430 

geeggcattt gagagggcta agttataaat cgcatgctgc tcatgcgcac atatctgeae 1490 

acagecaggg aaatcccttc gagagtgatt atgggacact tgtattggtt tegtgetatt 1550 

gttttattca gcagcagtac ttagtgaggg tgagagcagg gtggtgagag tggagtgagt 1610 

gagtatgaac ctggtcagcg aggtgaacag cctgtaatga atgactctgt ct 1662 

<210> 14 
<211> 320 
<212> PRT 

<213> Haematococcus pluvialis 
<400> 14 

Met His Val Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala 
15 10 15 



Ala Ala Ser Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His 
20 25 30 



Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala 
35 40 45 
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Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly lie Thr Met Ala Leu Thr 
50 55 60 



lie lie Gly Thr Trp Thr Ala Val Phe Leu His Ala lie Phe Gin lie 
65 70 75 80 



Arg Leu Pro Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu 
85 90 95 



Ala Thr Ala Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His lie Ala 



100 105 110 



Ala Val Phe lie Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe lie Thr 
115 120 125 



Thr His Asp Ala Met His Gly Thr lie Ala Leu Arg His Arg Gin Leu 
130 135 140 



Asn Asp Leu Leu Gly Asn lie Cys lie Ser Leu Tyr Ala Trp Phe Asp 
145 150 155 160 



Tyr Ser Met Leu His Arg Lys His Trp Glu His His Asn His Thr Gly 
165 170 175 



Glu Val Gly Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val 
180 185 190 



Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe 
195 200 205 



Ala Arg Leu Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala Pro 
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Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala Pro lie Leu Ser Ala 
225 230 235 240 



Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro 
245 250 255 



Gly Pro Ala Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr 
260 265 270 



Ser Glu Ala Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp 
275 280 285 



Leu His Trp Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu 
290 295 300 



Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Aia Leu Ala 
305 310 315 320 



<210> 15 

<211> 729 

<212> DNA 

<213> Agrobacterium aurantiacum 
<220> 

<221> CDS 

<222> (1)..(729) 

<400> 15 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec acc age ctg 48 
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 
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96 



ate gtc teg ggc ggc ate ate gee get tgg ctg gee ctg cat gtg cat 
lie Val Ser Gly Gly He lie Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 

gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc ate ctg gcg ate gca 144 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala He Ala 
35 40 45 

aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 192 
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 

cat gac gcg atg cac ggg teg gtg gtg ccg ggg cgt ccg cgc gee aat 240 
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gec gga ttt teg tgg 288 
Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

cgc aag atg ate gtc aag cac atg gee cat cac cgc cat gee gga acc 33 6 

Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 

gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gee 384 
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 

cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432 
Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 

gtc ate gtg acg gtc tat gcg ctg ate ctt ggg gat cgc tgg atg tac 480 
Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

gtg gtc ttc tgg ccg ctg ccg teg ate ctg gcg teg ate cag ctg ttc 528 
Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 

gtg ttc ggc acc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
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gac cgc cac aat gcg egg teg teg egg ate age gac ccc gtg teg ctg 624 
Asp Arg His Asn Ala Arg Ser Ser Arg lie Ser Asp Pro Val Ser Leu 
195 200 205 

ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac 672 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 720 
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

acc gca tga 729 
Thr Ala 



<210> 16 

<211> 242 

<212> PRT 

<213> Agrobacterium aurantiacum 

<400> 16 



Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 



He Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 



Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala He Ala 
35 40 45 



Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 
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His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 



Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 



Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 



Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 



WO 2004/063359 
225 230 



43/357 
235 
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240 



Thr Ala 



<210> 17 

<211> 1631 

<212> DNA 

<213> Alcaligenes sp. 



<220> 

<221> CDS 

<222> (99) . . (827) 

<400> 17 

ctgcaggccg ggcccggtgg ccaatggtcg caaccggcag gactggaaca ggacggcggg 60 

ccggtctagg ctgtcgccct acgcagcagg agtttcgg atg tec gga egg aag cct 116 

Met Ser Gly Arg Lys Pro 
1 5 

ggc aca act ggc gac acg ate gtc aat etc ggt ctg acc gee gcg ate 164 
Gly Thr Thr Gly Asp Thr lie Val Asn Leu Gly Leu Thr Ala Ala lie 
10 15 20 

ctg ctg tgc tgg ctg gtc ctg cac gee ttt acg eta tgg ttg eta gat 212 
Leu Leu Cys Trp Leu Val Leu His Ala Phe Thr Leu Trp Leu Leu Asp 
25 30 35 

gcg gee gcg cat ccg ctg ctt gee gtg ctg tgc ctg get ggg ctg acc 260 
Ala Ala Ala His Pro Leu Leu Ala Val Leu Cys Leu Ala Gly Leu Thr 
40 45 50 

tgg ctg teg gtc ggg ctg ttc ate ate gcg cat gac gca atg cac ggg 308 
Trp Leu Ser Val Gly Leu Phe lie lie Ala His Asp Ala Met His Gly 
55 60 65 70 

tec gtg gtg ccg ggg egg ccg cgc gee aat gcg gcg ate ggg caa ctg 356 
Ser Val Val Pro Gly Arg Pro Arg Ala Asn Ala Ala lie Gly Gin Leu 
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75 
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80 



85 
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gcg ctg tgg etc tat gcg ggg ttc teg tgg ccc aag ctg ate gee aag 404 
Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp Pro Lys Leu lie Ala Lys 
90 95 100 

cac atg acg cat -cac egg cac gec ggc ace gac aac gat ccc gat ttc 452 
His Met Thr His His Arg His Ala Gly Thr Asp Asn Asp Pro Asp Phe 
105 110 115 

ggt cac gga ggg ccc gtg cgc tgg tac ggc age ttc gtc tec ace tat 500 
Gly His Gly Gly Pro Val Arg Trp Tyr Gly Ser Phe Val Ser Thr Tyr 
120 125 130 

ttc ggc tgg cga gag gga ctg ctg eta ccg gtg ate gtc ace ace tat 548 
Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro Val lie Val Thr Thr Tyr 
135 140 145 150 

gcg ctg ate ctg ggc gat cgc tgg atg tat gtc ate ttc tgg ccg gtc 596 
Ala Leu lie Leu Gly Asp Arg Trp Met Tyr Val lie Phe Trp Pro Val 
155 160 165 

ccg gee gtt ctg gcg teg ate cag att ttc gtc ttc gga act tgg ctg 644 
Pro Ala Val Leu Ala Ser lie Gin lie Phe Val Phe Gly Thr Trp Leu 
170 175 180 

ccc cac cgc ccg gga cat gac gat ttt ccc gac egg cac aac gcg agg 692 
Pro His Arg Pro Gly His Asp Asp Phe Pro Asp Arg His Asn Ala Arg 
185 190 195 

teg acc ggc ate ggc gac ccg ttg tea eta ctg acc tgc ttc cat ttc 740 
Ser Thr Gly lie Gly Asp Pro Leu Ser Leu Leu Thr Cys Phe His Phe 
200 205 210 

ggc ggc tat cac cac gaa cat cac ctg cat ccg cat gtg ccg tgg tgg 788 
Gly Gly Tyr His His Glu His His Leu His Pro His Val Pro Trp Trp 
215 220 225 230 

cgc ctg cct cgt aca cgc aag acc gga ggc cgc gca tga cgcaattcct 837 
Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly Arg Ala 
235 240 
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cattgtcgtg gcgacagtcc tcgtgatgga gctgaccgcc tattccgtcc accgctggat 



897 



tatgcacggc cccctaggct ggggctggca caagtcccat cacgaagagc acgaccacgc 



957 



gttggagaag aacgacctct acggcgtcgt cttcgcggtg ctggcgacga tcctcttcac 1017 

cgtgggcgcc tattggtggc cggtgctgtg gtggatcgcc ctgggcatga cggtctatgg 1077 

gttgatctat ttcatcctgc acgacgggct tgtgcatcaa cgctggccgt ttcggtatat 1137 

tccgcggcgg ggctatttcc gcaggctcta ccaagctcat cgcctgcacc acgcggtcga 1197 

ggggcgggac cactgcgtca gcttcggctt catctatgcc ccacccgtgg acaagctgaa 1257 

gcaggatctg aagcggtcgg gtgtcctgcg cccccaggac gagcgtccgt cgtgatctct 1317 

gatcccggcg tggccgcatg aaatccgacg tgctgctggc aggggccggc cttgccaacg 1377 

gactgatcgc gctggcgatc cgcaaggcgc ggcccgacct fccgcgtgctg ctgctggacc 1437 

gtgcggcggg cgcctcggac gggcatactt ggtcctgcca cgacaccgat ttggcgccgc 1497 

actggctgga ccgcctgaag ccgatcaggc gtggcgactg gcccgatcag gaggtgcggt 1557 

tcccagacca ttcgcgaagg ctccgggccg gatatggctc gatcgacggg cgggggctga 1617 

tgcgtgcggt gacc 1631 

<210> 18 
<211> 242 
<212> PRT 

<213> Alcaligenes sp. 
<400> 18 

Met Ser Gly Arg Lys Pro Gly Thr Thr Gly Asp Thr He Val Asn Leu 



1 



5 



10 



15 



Gly Leu Thr Ala Ala He Leu Leu Cys Trp Leu Val Leu His Ala Phe 
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20 25 30 



Thr Leu Trp Leu Leu Asp Ala Ala Ala His Pro Leu Leu Ala Val Leu 
35 40 45 



Cys Leu Ala Gly Leu Thx Trp Leu Ser Val Gly Leu Phe lie lie Ala 
50 55 60 



His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 .80 



Ala Ala lie Gly Gin Leu Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Pro Lys Leu lie Ala Lys His Met Thr His His Arg His Ala Gly Thr 
100 105 110 



Asp Asn Asp Pro Asp Phe Gly His Gly Gly Pro Val Arg Trp Tyr Gly 
115 120 125 



Ser Phe Val Ser Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val He Val Thr Thr Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val He Phe Trp Pro Val Pro Ala Val Leu Ala Ser He Gin He Phe 
165 170 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Asp Phe Pro 
180 185 190 
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Asp Arg His Asn Ala Arg Ser Thr Gly lie Gly Asp Pro Leu Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



Pro His Val Pro Trp Trp Arg Leu Pro Arg Thx Arg Lys Thr Gly Gly 
225 230 235 240 



Arg Ala 



<210> 19 

<211> 729 

<212> DNA 

<213> Paracoccus marcusii 



<220> 

<221> CDS 

<222> (1)..(729) 

<400> 19 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec aca age ctg 48 
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 

ate gtc teg ggc ggc ate ate gee gca tgg ctg gee ctg cat gtg cat 96 
lie Val Ser Gly Gly lie lie Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 

gcg ctg tgg ttt ctg gac gcg gcg gee cat ccc ate ctg gcg gtc gcg 144 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro lie Leu Ala Val Ala 
35 40 45 

aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 192 
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 



WO 2004/063359 
50 55 
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60 
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cat gac gcg atg cac ggg teg gtc gtg ccg ggg cgt ccg cgc gec aat 240 
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 .75 80 



gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gec gga ttt teg tgg 288 

Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

cgc aag atg ate gtc aag cac atg gec cat cac cgc cat gee gga ace 336 

Arg Lys Met lie Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 



gac gac gac cca gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gec 384 
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 

cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432 
Arg Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



gtc ate gtg acg gtc tat gcg ctg ate ctg ggg gat cgc tgg atg tac 480 
Val lie Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



gtg gtc ttc tgg ccg ttg ccg teg ate ctg gcg teg ate cag ctg ttc 528 
Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser lie Gin Leu Phe 
165 170 175 



gtg ttc ggc act tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



gac cgc cat aat gcg egg teg teg egg ate age gac cct gtg teg ctg 624 
Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 



ctg acc tgc ttt cat ttt ggc ggt tat 
Leu Thr Cys Phe His Phe Gly Gly Tyr 
210 215 



cat 
His 



cac gaa cac cac ctg cac 
His Glu His His Leu His 
220 



672 
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ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 720 
Pro Thr Val Pro Tip Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

acc gca tga 729 
Thr Ala 



<210> 20 
<211> 242 
<212> PRT 

<213> Paracoccus marcusii 
<400> 20 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 



lie Val Ser Gly Gly lie He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 



Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala Val Ala 
35 40 45 



Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 



His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 



Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 
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Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 



Arg Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val lie Val Thr Val Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val Val Phe Trp Pro Leu Pro Ser lie Leu Ala Ser lie Gin Leu Phe 
165 170 175 



Val Phe Gly -Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



Asp Arg His Asn Ala Arg Ser Ser Arg lie Ser Asp Pro Val Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 



Thr Ala 



<210> 21 
<211> 1629 
<212> DNA 



WO 2004/063359 
<213> Synechocystis sp. 



51/357 
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<220> 

<221> CDS 

<222> (1)..(1629) 



<400> 21 

atg ate acc acc gat gtt gtc att att ggg gcg ggg cac aat ggc tta 48 
Met lie Thr Thr Asp Val Val lie lie Gly Ala Gly His Asn Gly Leu 
1 5 10 15 



gtc tgt gca gec tat ttg etc caa egg ggc ttg ggg gtg acg tta eta 96 
Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 



gaa aag egg gaa gta cca ggg ggg gcg gee acc aca gaa get etc atg 144 
Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 40 45 



ccg gag eta tec ccc cag ttt cgc ttt aac cgc tgt gee att gac cac 192 
Pro Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala lie Asp His 
50 55 60 



gaa ttt ate ttt ctg ggg ccg gtg ttg 
Glu Phe lie Phe Leu Gly Pro Val Leu 
65 70 

tat ggt ttg gaa tat tta ttt tgt gac 
Tyr Gly Leu Glu Tyr Leu Phe Cys Asp 
85 

ctg gat ggc caa get ttt atg age tac 
Leu Asp Gly Gin Ala Phe Met Ser Tyr 
100 105 



cag gag eta aat tta gee cag 240 
Gin Glu Leu Asn Leu Ala Gin 
75 80 

ccc agt gtt ttt tgt ccg ggg 288 
Pro Ser Val Phe Cys Pro Gly 
90 95 

cgt tec eta gaa aaa acc tgt 336 
Arg Ser Leu. Glu Lys Thr Cys 
110 



gee cac att gee acc tat age ccc cga gat gcg gaa aaa tat egg caa 384 
Ala His lie Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 



ttt gtc aat tat tgg acg gat ttg etc aac get gtc cag cct get ttt 



432 
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Pile Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe . 
130 135 140 

aat get ccg ccc cag get tta eta gat tta gec ctg aac tat ggt tgg 480 
Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
145 150 155 160 

gaa aac tta aaa tec gtg ctg gcg ate gee ggg teg aaa acc aag gcg 52 8 

Glu Asn Leu Lys Ser Val Leu Ala lie Ala Gly Ser Lys Thr Lys Ala 
165 170 175 

ttg gat ttt ate cgc act atg ate ggc tec ccg gaa gat gtg etc aat 576 
Leu Asp Phe lie Arg Thr Met lie Gly Ser Pro Glu Asp Val Leu Asn 
180 185 190 

gaa tgg ttc gac age gaa egg gtt aaa get cct tta get aga eta tgt 624 
Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
195 200 205 



teg gaa att ggc get ccc cca tec caa aag ggt agt age tec ggc atg 672 
Ser Glu lie Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 
210 215 220 

atg atg gtg gee atg egg cat ttg gag gga att gee aga cca aaa gga 72 0 

Met Met Val Ala Met Arg His Leu Glu Gly lie Ala Arg Pro Lys Gly 
225 230 235 240 

ggc act gga gee etc aca gaa gec ttg gtg aag tta gtg caa gee caa 768 
Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gin Ala Gin 
245 250 255 

ggg gga aaa ate etc act gac caa acc gtc aaa egg gta ttg gtg gaa 816 
Gly Gly Lys lie Leu Thr Asp Gin Thr Val Lys Arg Val Leu Val Glu 
260 265 270 

aac aac cag gcg ate ggg gtg gag gta get aac gga gaa cag tac egg 864 
Asn Asn Gin Ala He Gly Val Glu Val Ala Asn Gly Glu Gin Tyr Arg 
275 280 285 



gec aaa aaa ggc gtg att tct aac ate gat gec cgc cgt tta ttt ttg 
Ala Lys Lys Gly Val He Ser Asn He Asp Ala Arg Arg Leu Phe Leu 



912 
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300 
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caa ttg gtg gaa ccg ggg gcc eta gec 
Gin Leu Val Glu Pro Gly Ala Leu Ala 
305 310 

gaa cga ctg gaa egg cgc act gtg aac 
Glu Arg Leu Glu Arg Arg Thr Val Asn 
325 



aag gtg aat caa aac eta ggg 960 
Lys Val Asn Gin Asn Leu Gly 
315 320 

aat aac gaa gcc att tta aaa 1008 
Asn Asn Glu Ala lie Leu Lys 
330 335 



ate gat tgt gcc etc tec ggt tta ccc cac ttc act gcc atg gcc ggg 1056 
He Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
340 345 350 

ccg gag gat eta acg gga act att ttg att gcc gac teg gta cgc cat 1104 
Pro Glu Asp Leu Thr Gly Thr He Leu He Ala Asp Ser Val Arg His 
355 360 365 

gtc gag gaa gcc cac gcc etc att gcc ttg ggg caa att ccc gat get 1152 
Val Glu Glu Ala His Ala Leu He Ala Leu Gly Gin He Pro Asp Ala 
370 375 380 

aat ccg tct tta tat ttg gat att ccc act gta ttg gac ccc ace atg 1200 
Asn Pro Ser Leu Tyr Leu Asp He Pro Thr Val Leu Asp Pro Thr Met 
385 390 395 400 

gcc ccc cct ggg cag cac acc etc tgg ate gaa ttt ttt gcc ccc tac 1248 
Ala Pro Pro Gly Gin His Thr Leu Trp He Glu Phe Phe Ala Pro Tyr 
405 410 415 

cgc ate gcc ggg ttg gaa ggg aca ggg tta atg ggc aca ggt tgg acc 1296 
Arg He Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 

gat gag tta aag gaa aaa gtg gcg gat egg gtg att gat aaa tta acg 1344 
Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val He Asp Lys Leu Thr 
435 440 445 

gac tat gcc cct aac eta aaa tct ctg ate att ggt cgc cga gtg gaa 1392 
Asp Tyr Ala Pro Asn Leu Lys Ser Leu He He Gly Arg Arg Val Glu 
450 455 460 
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agt ccc gcc gaa ctg gcc caa egg ctg gga agt tac aac ggc aat gtc 1440 
Ser Pro Ala Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
465 470 475 480 

tat cat ctg gat atg agt ttg gac caa atg atg ttc etc egg cct eta 1488 
Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 495 

ccg gaa att gcc aac tac caa ace ccc ate aaa aat ctt tac tta aca 1536 
Pro Glu lie Ala Asn Tyr Gin Thr Pro lie Lys Asn Leu Tyr Leu Thr 
500 505 510 

999 gc<J acc cat ccc ggt ggc tec ata tea ggt atg ccc ggt aga 1584 

Gly Ala Gly Thr His Pro Gly Gly Ser lie Ser Gly Met Pro Gly Arg 
515 520 525 

aat tgc get egg gtc ttt tta aaa caa caa cgt cgt ttt tgg taa 1629 
Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 



<210> 22 
<211> 542 
<212> PRT 

<213> Synechocystis sp. 
<400> 22 

Met lie Thr Thr Asp Val Val lie lie Gly Ala Gly His Asn Gly Leu 
15 10 15 



Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 

Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 40 45 
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Pro Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala lie Asp His 
50 55 60 



Glu Phe lie Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 
65 70 75 80 



Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90 95 



Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys 
100 105 110 



Ala His lie Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 



Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
130 135 140 



Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
145 150 155 160 



Glu Asn Leu Lys Ser Val Leu Ala lie Ala Gly Ser Lys Thr Lys Ala 
165 170 175 



Leu Asp Phe lie Arg Thr Met lie Gly Ser Pro Glu Asp Val Leu Asn 
180 185 190 



Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
195 200 205 



Ser Glu lie Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 
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210 215 220 



Met Met Val Ala Met Arg His Leu Glu Gly He Ala Arg Pro Lys Gly 
225 230 235 240 



Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gin Ala Gin 
245 250 255 



Gly Gly Lys He Leu Thr Asp Gin Thr Val Lys Arg Val Leu Val Glu 
260 265 270 



Asn Asn Gin Ala He Gly Val Glu Val Ala Asn Gly Glu Gin Tyr Arg 
275 280 285 



Ala Lys Lys Gly Val He Ser Asn He Asp Ala Arg Arg Leu Phe Leu 
290 295 300 



Gin Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gin Asn Leu Gly 
305 310 315 320 



Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala He Leu Lys 
325 330 335 



He Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
340 345 350 



Pro Glu Asp Leu Thr Gly Thr He Leu He Ala Asp Ser Val Arg His 
355 360 365 



Val Glu Glu Ala His Ala Leu He Ala Leu Gly Gin He Pro Asp Ala 
370 375 380 
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Asn Pro Ser Leu Tyr Leu Asp lie Pro Thr Val Leu Asp Pro Thr Met 
385 390 395 400 



Ala Pro Pro Gly Gin His Thr Leu Trp He Glu Phe Phe Ala Pro Tyr 
405 410 415 



Arg He Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 



Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val He Asp Lys Leu Thr 
435 440 445 



Asp Tyr Ala Pro Asn Leu Lys Ser Leu He He Gly Arg Arg Val Glu 
450 455 460 



Ser Pro Ala Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
465 470 475 480 



Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 495 



Pro Glu He Ala Asn Tyr Gin Thr Pro He Lys Asn Leu Tyr Leu Thr 
500 505 510 



Gly Ala Gly Thr His Pro Gly Gly Ser He Ser Gly Met Pro Gly Arg 
515 520 525 



Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 



<210> 23 



WO 2004/063359 
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<211> 776 
<212> DNA 

<213> Bradyrhizobium sp. 



<220> 

<221> CDS 

<222> (1) . . (774) 

<400> 23 

atg cat gca gca acc gcc aag get act gag ttc ggg gec tct egg cgc 48 
Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg 
15 10 15 

gac gat gcg agg cag cgc cgc gtc ggt etc acg ctg gcc gcg gtc ate 96 
Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val lie 
20 25 30 

ate gcc gcc tgg ctg gtg ctg cat gtc ggt ctg atg ttc ttc tgg ccg 144 
lie Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 40 45 

ctg acc ctt cac age ctg ctg ccg get ttg cct ctg gtg gtg ctg cag 192 
Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 55 60 

acc tgg etc tat gta ggc ctg ttc ate ate gcg cat gac tgc atg cac 240 
Thr Trp Leu Tyr Val Gly Leu Phe He He Ala His Asp Cys Met His 
65 70 75 80 

ggc teg ctg gtg ccg ttc aag ccg cag gtc aac cgc cgt ate gga cag 288 
Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg He Gly Gin 
85 90 95 

etc tgc ctg ttc etc tat gcc ggg ttc tec ttc gac get etc aat gtc 336 
Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 110 



gag cac cac aag cat cac cgc cat ccc ggc acg gcc gag gat ccc gat 
Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp 
115 120 125 



384 
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ttc gac gag gtg ccg ccg cac ggc ttc tgg cac tgg ttc gcc age ttt 432 
Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 140 

ttc ctg cac tat ttc ggc tgg aag cag gtc gcg ate ate gca gcc gtc 480 
Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala lie He Ala Ala Val 
145 150 155 160 

teg ctg gtt tat cag etc gtc ttc gcc gtt ccc ttg cag aac ate ctg 528 
Ser Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn He Leu 
165 170 175 

ctg ttc tgg gcg ctg ccc ggg ctg ctg teg gcg ctg cag ctg ttc ace 576 
Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 185 190 

ttc ggc acc tat ctg ccg cac aag ccg gcc acg cag ccc ttc gcc gat 624 
Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 

cgc cac aac gcg egg acg age gaa ttt ccc gcg tgg ctg teg ctg ctg 672 
Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 

acc tgc ttc cac ttc ggc ttt cat cac gag cat cat ctg cat ccc gat 720 
Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 235 240 

gcg ccg tgg tgg egg ctg ccg gag ate aag egg egg gcc ctg gaa agg 768 
Ala Pro Trp Trp Arg Leu Pro Glu He Lys Arg Arg Ala Leu Glu Arg 
245 250 255 

cgt gac ta 776 
Arg Asp 



<210> 24 

<211> 258 

<212> PRT 

<213> Bradyrhizobium sp. 



WO 2004/063359 
<400> 24 



60/357 



PCT/EP2004/000099 



Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg 
15 10 15 



Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val lie 
20 25 30 



He Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 40 45 



Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 55 60 



Thr Trp Leu Tyr Val Gly Leu Phe He He Ala His Asp Cys Met His 
65 70 75 80 



Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg lie Gly Gin 
85 90 95 



Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 110 



Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp 
115 120 125 



Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 140 



Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala He He Ala Ala Val 
145 150 155 160 
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Ser Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn He Leu 
165 170 175 



Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 185 190 



Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 



Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 



Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 - 235 240 



Ala Pro Trp Trp Arg Leu Pro Glu He Lys Arg Arg Ala Leu Glu Arg 
245 250 255 



Arg Asp 



<210> 25 

<211> 777 

<212> DNA 

<213> Nostoc sp. 



<220> 

<221> CDS 

<222> (1) . . (777) 



<400> 25 

atg gtt cag tgt caa cca tea tct ctg cat tea gaa aaa ctg gtg tta 

Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu 
15 10 15 



48 
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ttg tea teg aca ate aga gat gat aaa*aat att aat aag ggt ata ttt 96 
Leu Ser Ser Thr He Arg Asp Asp Lys Asn He Asn Lys Gly He Phe 
20 25 30 



att gec tgc ttt ate tta ttt tta tgg gca att agt tta ate tta tta 144 
lie Ala Cys Phe He Leu Phe Leu Trp Ala He Ser Leu He Leu Leu 
35 40 45 



etc tea ata gat aca tec ata att cat 
Leu Ser He Asp Thr Ser He He His 
50 55 

atg ctt tgg cag ace ttc tta tat aca 
Met Leu Trp Gin Thr Phe Leu Tyr Thr 
65 70 

gat gec atg cac ggc gta gtt tat ccc 
Asp Ala Met His Gly Val Val Tyr Pro 
85 



aag age tta tta ggt ata gec 192 
Lys Ser Leu Leu Gly He Ala 
60 

ggt tta ttt att act get cat 240 
Gly Leu Phe He Thr Ala His 
75 80 

aaa aat ccc aga ata aat aat 288 
Lys Asn Pro Arg He Asn Asn 
90 95 



ttt ata ggt aag etc act eta ate ttg tat gga eta etc cct tat aaa 336 
Phe He Gly Lys Leu Thr Leu He Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 



gat tta ttg aaa aaa cat tgg tta cac cac gga cat cct ggt act gat 384 
Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 125 



tta gac cct gat tat tac aat ggt cat ccc caa aac ttc ttt ctt tgg 432 
Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 

tat eta cat ttt atg aag tct tat tgg cga tgg acg caa att ttc gga 480 
Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gin He Phe Gly 
145 150 155 160 



tta gtg atg att ttt cat gga ctt aaa aat ctg gtg cat ata cca gaa 528 
Leu Val Met He Phe His Gly Leu Lys Asn Leu Val His He Pro Glu 
165 170 175 

aat aat tta att ata ttt tgg atg ata cct tct att tta agt tea gta 576 
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Asn Asn Leu lie lie Phe Txp Met He Pro Ser lie Leu Ser Ser Val 
180 185 190 

caa eta ttt tat ttt ggt aca ttt ttg cct cat aaa aag eta gaa ggt 624 
Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 205 

ggt tat act aac ccc cat tgt gcg cgc agt ate cca tta cct ctt ttt 672 
Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He Pro Leu Pro Leu Phe 
210 215 220 

tgg tct ttt gtt act tgt tat cac ttc ggc tac cac aag gaa cat cac 720 
Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 

gaa tac cct caa ctt cct tgg tgg aaa tta cct gaa get cac aaa ata 768 
Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys He 
245 250 255 

tct tta taa 777 
Ser Leu 



<210> 26 

<211> 258 

<212> PRT 

<213> Nostoc sp. 

<400> 26 

Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu 
15 10 15 



Leu Ser Ser Thr He Arg Asp Asp Lys Asn He Asn Lys Gly He Phe 
20 25 30 



He Ala Cys Phe He Leu Phe Leu Trp Ala He Ser Leu He Leu Leu 
35 40 45 
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Leu Ser lie Asp Thr Ser lie lie His Lys Ser Leu Leu Gly He Ala 
50 55 60 



Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His 
65 70 75 80 



Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg lie Asn Asn 
85 90 95 



Phe He Gly Lys Leu Thr Leu He Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 



Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 125 



Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 



Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gin He Phe Gly 
145 150 155 160 



Leu Val Met He Phe His Gly Leu Lys Asn Leu Val His He Pro Glu 
165 170 175 



Asn Asn Leu He He Phe Trp Met He Pro Ser He Leu Ser Ser Val 
180 185 190 



Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 205 
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Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He Pro Leu Pro Leu Phe 
210 215 220 



Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 



Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys He 
245 250 255 



Ser Leu 



<210> 27 

<211> 789 

<212> DNA 

<213> Nostoc punctiforme 



<220> 

<221> CDS 

<222> (1)..(789) 



<400> 27 

ttg aat ttt tgt gat aaa cca gtt age tat tat gtt gca ata gag caa 48 

Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyx Val Ala He Glu Gin 
1 .5 10 15 

tta agt get aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta 96 
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val He Val He Val 
20 25 30 

att att agt ctt tgg gta get agt ttg get ttt tta eta get att aat 144 
He He Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala He Asn 
35 40 45 

tat gee aaa gtc cca att tgg ttg ata cct att gca ata gtt tgg caa 192 
Tyr Ala Lys Val Pro He Trp Leu He Pro He Ala He Val Trp Gin 
50 55 60 
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atg ttc ctt tat aca ggg eta ttt att act gca cat gat get atg cat 240 
Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 
65 70 75 80 

ggg tea gtt tat cgt aaa aat ccc aaa att aat aat ttt ateggt tea 288 
Gly Ser Val Tyr Arg Lys Asn Pro Lys He Asn Asn Phe He Gly Ser 
85 90 95 

eta get gta gcg ctt tac get gtg ttt cca tat caa cag atg tta aag 336 
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 110 

aat cat tgc tta cat cat cgt cat cct get age gaa gtt gac cca gat 384 
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 125 

ttt cat gat ggt aag aga aca aac get att ttc tgg tat etc cat ttc 432 
Phe His Asp Gly Lys Arg Thr Asn Ala He Phe Trp Tyr Leu His Phe 
130 135 140 

atg ata gaa tac tec agt tgg caa cag tta ata gta eta act ate eta 480 
Met He Glu Tyr Ser Ser Trp Gin Gin Leu He Val Leu Thr He Leu 
145 150 155 160 

ttt aat tta get aaa tac gtt ttg cac ate cat caa ata aat etc ate 528 
Phe. Asn Leu Ala Lys Tyr Val Leu His He His Gin He Asn Leu He 
165 170 175 

tta ttt tgg agt att cct cca att tta agt tec att caa ctg ttt tat 576 
Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He Gin Leu Phe Tyr 
180 185 190 

ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat 624 
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 205 

ccc cat tgc age caa aca ata aaa ttg cca act ttt ttg tea ttt ate 672 
Pro His Cys Ser Gin Thr He Lys Leu Pro Thr Phe Leu Ser Phe He 
210 215 220 



get tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat 



720 
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Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 

gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac 768 
Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
245 250 255 

aat tea gta acc aat teg taa 789 
Asn Ser Val Thr Asn Ser 
260 



<210> 28 
<211> 262 
<212> PRT 

<213> Nostoc punctif orme 
<400> 28 

Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala lie Glu Gin 
15 10 15 



Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val lie Val lie Val 
20 25 30 



lie lie Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala He Asn 
35 40 45 



Tyr Ala Lys Val Pro He Trp Leu He Pro He Ala He Val Trp Gin 
50 55 60 



Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 
65 70 75 80 



Gly Ser Val Tyr Arg Lys Asn Pro Lys He Asn Asn Phe He Gly Ser 
85 90 95 
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Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 HO 



Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 125 



Phe His Asp Gly Lys Arg Thr Asn Ala lie Phe Trp Tyr Leu His Phe 
130 135 140 



Met lie Glu Tyr Ser Ser Trp Gin Gin Leu lie Val Leu Thr lie Leu 
145 150 155 160 



Phe Asn Leu Ala Lys Tyr Val Leu His He His Gin He Asn Leu He 
165 170 175 



Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He Gin Leu Phe Tyr 
180 185 190 



Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 205 



Pro His Cys Ser Gin Thr He Lys Leu Pro Thr Phe Leu Ser Phe He 
210 215 220 



Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 



Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
245 250 255 



Asn Ser Val Thr Asn Ser 



WO 2004/063359 
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<210> 29 

<211> 762 

<212> DNA 

<213> Nostoc punctiforme 



<220> 

<221> CDS 

<222> (1)..(762) 



<400> 29 

gtg ate cag tta gaa caa cca etc agt cat caa gca aaa ctg act cca 48 
Val lie Gin Leu Glu Gin Pro Leu Ser His Gin Ala Lys Leu Thr Pro 
15 10 15 



gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att get att gtc 96 
Val Leu Arg Ser Lys Ser Gin Phe Lys Gly Leu Phe He Ala He Val 
20 25 30 



att gtt age gca tgg gtc att age ctg agt tta tta ctt tec ctt gac 144 
He Val Ser Ala Trp Val He Ser Leu Ser Leu Leu Leu Ser Leu Asp 
35 40 45 



ate tea aag eta aaa ttt tgg atg tta ttg cct gtt ata eta tgg caa 192 
He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val He Leu Trp Gin 
50 55 60 



aca ttt tta tat acg gga tta ttt att aca tct cat gat gee atg cat 240 
Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser His Asp Ala Met His 
65 70 75 80 



ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca 288 
Gly Val Val Phe Pro Gin Asn Thr Lys He Asn His Leu He Gly Thr 
85 90 95 



ttg acc eta tec ctt tat ggt ctt tta cca tat caa aaa eta ttg aaa 336 
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gin Lys Leu Leu Lys 
100 105 110 
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aaa cat tgg tta cac cac cac aat cca gca age tea ata gac ccg gat 384 
Lys His Trp Leu His His His Asn Pro Ala Ser Ser lie Asp Pro Asp 
115 120 125 

ttt cac aat ggt aaa cac caa agt ttc ttt get tgg tat ttt cat ttt 432 
Phe His Asn Gly Lys His Gin Ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 140 

atg aaa ggt tac tgg agt- tgg ggg caa ata att gcg ttg act att att 480 
Met Lys Gly Tyr Trp Ser Trp Gly Gin He He Ala Leu Thr He He 
145 150 155 160 

tat aac ttt get aaa tac ata etc cat ate cca agt gat aat eta act 528 
Tyr Asn Phe Ala Lys Tyr He Leu His He Pro Ser Asp Asn Leu Thr 
165 170 175 

tac ttt tgg gtg eta ccc teg ctt tta agt tea tta caa tta ttc tat 576 
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gin Leu Phe Tyr 
180 185 190 

ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag 624 
Phe Gly Thr Phe Leu Pro His Ser Glu Pro He Gly Gly Tyr Val Gin 
195 200 205 

cct cat tgt gee caa aca att age cgt cct att tgg tgg tea ttt ate 672 
Pro His Cys Ala Gin Thr He Ser Arg Pro He Trp Trp Ser Phe He 
210 215 220 

acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat 720 
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 

att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag 762 
He Ser Trp Trp Gin Leu Pro Glu He Tyr Lys Ala Lys 
245 250 



<210> 30 
<211> 253 



<212> 
<213> 



PRT 

Nostoc punctiforme 
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<400> 30 

Val He Gin Leu Glu Gin Pro Leu Ser His Gin Ala Lys Leu Thr Pro 
15 10 15 



Val Leu Arg Ser Lys Ser Gin Phe Lys Gly Leu Phe He Ala He Val 
20 25 30 



He Val Ser Ala Trp Val He Ser Leu Ser Leu Leu Leu Ser Leu Asp 
35 40 45 



He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val He Leu Trp Gin 
50 55 60 



Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser His Asp Ala Met His 
65 70 75 80 



Gly Val Val Phe Pro Gin Asn Thr Lys He Asn His Leu He Gly Thr 
85 90 95 



Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gin Lys Leu Leu Lys 
100 105 110 



Lys His Trp Leu His His His Asn Pro Ala Ser Ser He Asp Pro Asp 
115 120 125 



Phe His Asn Gly Lys His Gin Ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 140 



Met Lys Gly Tyr Trp Ser Trp Gly Gin He He Ala Leu Thr He He 
145 150 155 160 
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Tyr Asn Phe Ala Lys Tyr lie Leu His lie Pro Ser Asp Asn Leu Thr 
165 170 175 

Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gin Leu Phe Tyr 
180 185 190 

Phe Gly Thr Phe Leu Pro His Ser Glu Pro He Gly Gly Tyr Val Gin 
195 200 205 

Pro His Cys Ala Gin Thr He Ser Arg Pro He Trp Trp Ser Phe He 
210 215 220 

Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 

He Ser Trp Trp Gin Leu Pro Glu He Tyr Lys Ala Lys 
245 250 



<210> 31 

<211> 1608 

<212> DNA 

<213> Haematococcus pluvialis 
<220> 

<221> CDS 

<222> (3).. (971) 

<400> 31 

ct aca ttt cac aag ccc gtg age ggt gca age get ctg ccc cac ate 47 

Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His He 

15 10 15 



ggc cca cct cct cat etc cat egg tea ttt get get ace acg atg ctg 



95 
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Gly Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu 
20 25 30 

teg aag ctg cag tea ate age gtc aag gee cgc cgc gtt gaa eta gec 143 
Ser Lys Leu Gin Ser lie Ser Val Lys Ala Arg Arg Val Glu Leu Ala 
35 40 45 

cgc gac ate acg egg ccc aaa gtc tgc ctg cat get cag egg tgc teg 191 
Arg Asp lie Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser 
50 55 60 

tta gtt egg ctg cga gtg gca gca cca cag aca gag gag gcg ctg gga 239 
Leu Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly 
65 70 75 

ace gtg cag get gee ggc gcg ggc gat gag cac age gee gat gta gca 287 
Thr Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala 
80 85 90 95 

etc cag cag ctt gac egg get ate gca gag cgt cgt gee egg cgc aaa 335 
Leu Gin Gin Leu Asp Arg Ala lie Ala Glu Arg Arg Ala Arg Arg Lys 
100 105 110 

egg gag cag ctg tea tac cag get gee gee att gca gca tea. att ggc 383 
Arg Glu Gin Leu Ser Tyr Gin Ala Ala Ala lie Ala Ala Ser lie Gly 
115 120 125 

gtg tea ggc att gee ate ttc gee acc tac ctg aga ttt gee atg cac 431 
Val Ser Gly lie Ala He Phe Ala Thr Tyr Leu Arg Phe Ala Met His 
130 135 140 

atg acc gtg ggc ggc gca gtg cca tgg ggt gaa gtg get ggc act etc 479 
Met Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu 
145 150 155 

etc ttg gtg gtt ggt ggc gcg etc ggc atg gag atg tat gee cgc tat 527 
Leu Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr 
160 165 170 175 



gca cac aaa gee ate tgg cat gag teg cct ctg ggc tgg ctg ctg cac 
Ala His Lys Ala He Trp His Glu Ser Pro Leu Gly Trp Leu Leu His 
180 185 190 



575 
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aag age cac cac aca cct cgc act gga ccc ttt gaa gec aac gac ttg 623 
Lys Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu 
195 200 205 

ttt gca ate ate aat gga ctg ccc gee atg etc ctg tgt ace ttt ggc 671 
Phe Ala lie lie Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly 
210 215 220 

ttc tgg ctg ccc aac gtc ctg ggg gcg gee tgc ttt gga gcg ggg ctg 719 
Phe Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu 
225 230 235 

ggc ate acg eta tac ggc atg gca tat atg ttt gta cac gat ggc ctg 767 
Gly lie Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu 
240 245 250 255 

gtg cac agg cgc ttt ccc ace ggg ccc ate get ggc ctg ccc tac atg 815 
Val His Arg Arg Phe Pro Thr Gly Pro lie Ala Gly Leu Pro Tyr Met 
260 265 270 

aag cgc ctg aca gtg gee cac cag eta cac cac age ggc aag tac ggt 863 
Lys Arg Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly 
275 280 285 

ggc gcg ccc tgg ggt atg ttc ttg ggt cca cag gag ctg cag cac att 911 
Gly Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His lie 
290 295 300 

cca ggt gcg gcg gag gag gtg gag cga ctg gtc ctg gaa ctg gac tgg 959 
Pro Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp 
305 310 315 

tec aag egg tag ggtgcggaac caggcacgct ggtttcacac ctcatgcctg 1011 

Ser Lys Arg 

320 

tgataaggtg tggctagagc gatgcgtgtg agaegggtat gtcaeggteg actggtctga 1071 
tggccaatgg catcggccat gtctggtcat caegggctgg ttgcctgggt gaaggtgatg 1131 



cacatcatca tgtgcggttg gaggggctgg cacagtgtgg gctgaactgg agcagttgtc 1191 
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caggctggcg ttgaatcagt gagggtttgt gattggcggt tgtgaagcaa tgactccgcc 1251 

catattctat ttgtgggagc tgagatgatg gcatgcttgg gatgtgcatg gatcatggta 1311 

gtgcagcaaa ctatattcac ctagggctgt tggtaggatc aggtgaggcc ttgcacattg 1371 

catgatgtac tcgtcatggt gtgttggtga gaggatggat gtggatggat gtgtattctc 1431 

agacgtagac cttgactgga ggcttgatcg agagagtggg ccgtattctt tgagagggga 1491 

ggctcgtgcc agaaatggtg agtggatgac tgtgacgctg tacattgcag gcaggtgaga 1551 

tgcactgtct cgattgtaaa atacattcag atgcaaaaaa aaaaaaaaaa aaaaaaa 1608 

<210> 32 
<211> 322 
<212> PRT 

<213> Haematococcus pluvialis 
<400> 32 

Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His lie Gly 
15 10 15 

Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu Ser 



20 



25 



30 



Lys Leu Gin Ser lie Ser Val Lys Ala Arg Arg Val Glu Leu Ala Arg 



35 



40 



45 



Asp He Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser Leu 



50 



55 



60 



Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly Thr 
65 70 75 80 
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Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala Leu 
85 90 95 



Gin Gin Leu Asp Arg Ala lie Ala Glu Arg Arg Ala Arg Arg Lys Arg 
100 105 , 110 



Glu Gin Leu Ser Tyr Gin Ala Ala Ala lie Ala Ala Ser lie Gly Val 
115 120 125 



Ser Gly lie Ala lie Phe Ala Thr Tyr Leu Arg Phe Ala Met His Met 
130 135 140 



Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu Leu 
145 150 155 160 



Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr Ala 
165 170 175 



His Lys Ala lie Trp His Glu Ser Pro Leu Gly Trp Leu Leu His Lys 
180 185 190 



Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu Phe 
195 200 205 



Ala lie lie Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly Phe 
210 215 220 



Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu Gly 
225 230 235 240 



He Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu Val 
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245 250 255 



His Arg Arg Phe Pro Thr Gly Pro lie Ala Gly Leu Pro Tyr Met Lys 
260 265 270 



Arg Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly Gly 
275 280 285 



Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His lie Pro 
290 295 300 



Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp Ser 
305 310 315 320 



Lys Arg 



<210> 33 

<211> 528 

<212> DNA 

<213> Erwinia uredovora 



<220> 

<221> CDS 

<222> (1)..(528) 



<400> 33 

atg ttg tgg att tgg aat gcc ctg ate gtt ttc gtt acc gtg att ggc 48 
Met Leu Trp lie Trp Asn Ala Leu lie Val Phe Val Thr Val lie Gly 
15 10 15 



atg gaa gtg att get gca ctg gca cac aaa tac ate atg cac ggc tgg 
Met Glu Val lie Ala Ala Leu Ala His Lys Tyr lie Met His Gly Trp 
20 25 30 



96 



WO 2004/063359 PCT/EP2004/000099 

78/357 

ggt tgg gga tgg cat ctt tea cat cat gaa ccg cgt aaa ggt gcg ttt 144 
Gly Trp Gly Trp His Leu Ser His His Glu Pro Arg Lys Gly Ala Phe 
35 40 45 

gaa gtt aac gat ctt tat gec gtg gtt ttt get gca tta teg ate ctg 192 
Glu Val Asn Asp Leu Tyr Ala Val Val Phe Ala Ala Leu Ser lie Leu 
50 55 60 

ctg att tat ctg ggc agt aca gga atg tgg ccg etc cag tgg att ggc 240 
Leu He Tyr Leu Gly Ser Thr Gly Met Trp Pro Leu Gin Trp He Gly 
65 70 75 80 

gca ggt atg acg gcg tat gga tta etc tat ttt atg gtg cac gac ggg 288 
Ala Gly Met Thr Ala Tyr Gly Leu Leu Tyr Phe Met Val His Asp Gly 
85 90 95 

ctg gtg cat caa cgt tgg cca ttc cgc tat att cca cgc aag ggc tac 33 6 

Leu Val His Gin Arg Trp Pro Phe Arg Tyr lie Pro Arg Lys Gly Tyr 
100 105 110 

etc aaa egg ttg tat atg gcg cac cgt atg cat cac gee gtc agg ggc 384 
Leu Lys Arg Leu Tyr Met Ala His Arg Met His His Ala Val Arg Gly 
115 120 125 

aaa gaa ggt tgt gtt tct ttt ggc ttc etc tat gcg ccg ccc ctg tea 432 
Lys Glu Gly Cys Val Ser Phe Gly Phe Leu Tyr Ala Pro Pro Leu Ser 
130 135 140 

aaa ctt cag gcg acg etc egg gaa aga cat ggc get aga gcg ggc get 480 
Lys Leu Gin Ala Thr Leu Arg Glu Arg His Gly Ala Arg Ala Gly Ala 
145 150 155 160 

gec aga gat gcg cag ggc ggg gag gat gag, ccc gca tec ggg aag taa 528 
Ala Arg Asp Ala Gin Gly Gly Glu Asp Glu Pro Ala Ser Gly Lys 
165 170 175 



<210> 34 

<211> 175 

<212> PRT 

<213> Erwinia uredovora 
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<400> 34 
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Met Leu Trp lie Trp Asn Ala Leu lie Val Phe Val Thr Val He Gly 
15 10 15 



Met Glu Val He Ala Ala Leu Ala His Lys Tyr He Met His Gly Trp 
20 25 30 



Gly Trp Gly Trp His Leu Ser His His Glu Pro Arg Lys Gly Ala Phe 
35 40 45 



Glu Val Asn Asp Leu Tyr Ala Val Val Phe Ala Ala Leu Ser He Leu 
50 55 60 



Leu He Tyr Leu Gly Ser Thr Gly Met Trp Pro Leu Gin Trp He Gly 
65 70 75 80 



Ala Gly Met Thr Ala Tyr Gly Leu Leu Tyr Phe Met Val His Asp Gly 
85 90 95 



Leu Val His Gin Arg Trp Pro Phe Arg Tyr He Pro Arg Lys Gly Tyr 
100 105 110 



Leu Lys Arg Leu Tyr Met Ala His Arg Met His His Ala Val Arg Gly 
115 120 125 



Lys Glu Gly Cys Val Ser Phe Gly Phe Leu Tyr Ala Pro Pro Leu Ser 
130 135 140 



Lys Leu Gin Ala Thr Leu Arg Glu Arg His Gly Ala Arg Ala Gly Ala 
145 150 155 160 
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Ala.Arg Asp Ala Gin Gly Gly Glu Asp Glu Pro Ala Ser Gly Lys 
165 170 175 



<210> 35 

<211> 1520 

<212> DNA 

<213> Artificial 

<220> 

<223> Promo tor 



<400> 35 

ctcgagtacc gaggcggaac ggcaggaatg tttccctctc ttttagaggg caattcttta 60 

tccaatgtca tgttgatgct agatatttct gtctcttata ataaggcgaa tacccatttt 120 

tgaattgaag ttgagataaa aaaaaagggg gcccaatttg tcaacgccaa agagtcaagc 180 

tttttctttg gctttagccg aacaatctaa gacttattgt ttttgaagat atttgacctt 240 

ttctagatat tccttcaagt aaagcttttt tcgagttttt tttttttttc tttgtgaagg 300 

atttattgtt attggtatcc attttttatt ggaagacaag ataagttaat attgattttg 360 

cttaaagatt aaaaggaaat cagaaaacga caataaaaaa tgtaacggac aaactatggt 420 

gtcgattata agtctaaatc cttaaaaaat gacaacgagt tgctttcctc tgaaaacaat 480 

tcttttgtct ttgcaagaaa ggtttctttt ttgtttgctt gcattactta aacatcaaat 540 

caaatgaaag gaataaagca gatttgaggg cgaataagga ttttctggtc aacaagatgt 600 

gagtgacacc taaggaacta aatgccattc atttgtttta aaacgacatc aaagattgat 660 

gatcaacagg attgagagag agaaaaagaa ctcgtgtcat ttatttctgt tgactgaaat 720 

tttatattta gaaaaaatgt caaatctata gctttagcta tattacataa catttgaaat 780 

aataataata aaaaaagaca cattagagac acttttcaaa ctctaaataa ctgtctataa 840 
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acacaaagaa aacaaagacc tctataacaa cttattagat ttttctcgta cttttgtcta 900 

aagatgatgt attcttgtta tcccacactt ctttcatttg ttcttgatgc tactaaatat 960 

acaaaatttc ttttttgcaa gagatattat tccaaaaatt ttcaaaaaga aatttttttc 1020 

acaatagcag ttgatcgtgt aacccaaaga ggttctttgt tattttgcac ttccgctttg 1080 

cggtgatgca tattcaaagt aatatatgga ataaacaacg tgtttaagca tgaaagaaag 1140 

gaaacaaagg ccgctttgaa caaatgcata atatttcaga caaaaatgat ctaaagcaag 1200 

cagtaaatca aacaagaaac attgctgatt cgcgttagaa aacgataaaa gtctaataag 1260 

ccactaagta tacttcaatg aactttttgt atgcttatgg tccaatcaga ccaataattt 1320 

gtgaccattc ctgaggtggc tttggtgatg cggaaacaga aaaaaatttt ctcaccaatc 1380 

gatttaaaaa acaatttctg ctttgaacca aaactttttt tttctcttta atcattaact 1440 

ttatcaagta tgtacctacc ctcaaagtcc tcactcaagc acaattatgc taacattgtt 1500 

ccaccttctc tttagaaatg 1520 

<210> 36 

<211> 16245 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 
<220> 

<221> misc_feature 

<222> (10264) • . (10264) 

<223> n is a, c, g, or t 

<220> 

<2 2 1> misc_f eatur e 
<222> (10472) . . (10472) 
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<223> n is a, c, g, or t 
<220> 

<221> misc_ feature 
<222> (10563) • . (10563) 
<223> n is a, c, g, or t 

<400> 36 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 42 0 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 
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acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgfctttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg. attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 
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taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agteagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 
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gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3 840 

cccfcgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 
gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 
cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 
tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 
ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 
gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 
tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 
ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 
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gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 582 0 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 
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cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 
aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 
aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 
cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 
tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 
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tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 
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cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
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ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 103 80 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt aatctataca 10800 

atgctccata gactcacatt gatattgtcg aagatttcga tgctgactta gtagagcaac 10860 

tacaaaagtt agcagagaag catgatttct taatctttga agaccgcaag tttgcagata 10920 

tcggtatgtg aattctatct attttttttc tgatgtgtgc atggatgact catgatcata 10980 

ttcttaggta atactgtcaa gcatcaatat ggcaagggcg tttacaagat tgcttcttgg 11040 

tctcatatta ctaatgctca cacagttcct ggagaaggta ttatcaaggg acttgccgaa 11100 . 
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gtcggcctcc ctcttggtcg tggcttgctt ttgctagcag aaatgtcatc tcaaggtgca 11160 

ttaactaagg gtatttacac tgccgaatct gtcaatatgg ctcgccgcaa caaagatttc 11220 

gtttttggct ttattgcaca acacaaaatg aatcagtatg atgatgagga ttttgttgtc 11280 

atgtcgcctg aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 11340 

cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 11400 

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 11460 

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 11520 

ttgggccaaa gacaaaaggg cgacattcaa ccgattgagg gagggaaggt aaatattgac 11580 

ggaaattatt cattaaaggt gaattatcac cgtcaccgac ttgagccatt tgggaattag 11640 

agccagcaaa atcaccagta gcaccattac cattagcaag gccggaaacg tcaccaatga 11700 

aaccatcgat agcagcaccg taatcagtag cgacagaatc aagtttgcct ttagcgtcag 11760 

actgtagcgc gttttcatcg gcattttcgg tcatagcccc cttattagcg tttgccatct 11820 

tttcataatc aaaatcaccg gaaccagagc caccaccgga accgcctccc tcagagccgc 11880 

caccctcaga accgccaccc tcagagccac caccctcaga gccgccacca gaaccaccac 11940 

cagagccgcc gccagcattg acaggaggcc cgatctagta acatagatga caccgcgcgc 12000 

gataatttat cctagtttgc gcgctatatt ttgttttcta tcgcgtatta aatgtataat 12060 

tgcgggactc taatcataaa aacccatctc ataaataacg tcatgcatta catgttaatt 12120 

attacatgct taacgtaatt caacagaaat tatatgataa tcatcgcaag accggcaaca 12180 

ggattcaatc ttaagaaact ttattgccaa atgtttgaac gatcggggat catccgggtc 12240 

tgtggcggga actccacgaa aatatccgaa cgcagcaaga tatcgcggtg catctcggtc 12300 

ttgcctgggc agtcgccgcc gacgccgttg atgtggacgc cgggcccgat catattgtcg 12360 
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cgattgtctg ttgtgcccag tcatagccga 
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gttgctgtcg taatgatatc ggcaccttcg 1242 0 

aagaactcca gcatgagatc cccgcgctgg 12480 

attccgaagc ccaacctttc atagaaggcg 12540 

ttgggcgtcg cttggtcggt catttcgaac 12600 

gaaggcgata gaaggcgatg cgctgcgaat 12660 

agcggtcagc ccattcgccg ccaagctctt 12720 

cctgatagcg gtccgccaca cccagccggc 12780 

tttccaccat gatattcggc aagcaggcat 12840 

cgggcatgcg cgccttgagc ctggcgaaca 12900 

cgtccagatc atcctgatcg acaagaccgg 12960 

gatgtttcgc ttggtggtcg aatgggcagg 13020 

ttgcatcagc catgatggat actttctcgg 13080 

gccccggcac ttcgcccaat agcagccagt 13140 

cagctgcgca aggaacgccc gtcgtggcca 13200 

gttcattcag ggcaccggac aggtcggtct 13260 

acagccggaa cacggcggca tcagagcagc 13320 

atagcctctc cacccaagcg gccggagaac 13380 

gaaacgatcc agatccggtg cagattafctt 13440 

gataccgagg ggaatttatg gaacgtcagt 13500 

ctgatagtga ccttaggcga cttttgaacg 13560 

gctcattaaa ctccagaaac ccgcggctga 13620 
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gtggctcctt caacgttgcg gttctgtcag ttccaaacgt aaaacggctt gtcccgcgtc 13680 
atcggcgggg gtcataacgt gactccctta attctccgct catgatcaga ttgtcgtttc 13740 
ccgccttcag tttaaactat cagtgtttga caggatatat tggcgggtaa acctaagaga 13800 
aaagagcgtt tattagaata atcggatatt taaaagggcg tgaaaaggtt tatccgttcg 13860 
tccatttgta tgtgcatgcc aaccacaggg ttccccagat ctggcgccgg ccagcgagac 13920 
gagcaagatt ggccgccgcc cgaaacgatc cgacagcgcg cccagcacag gtgcgcaggc 13980 
aaattgcacc aacgcataca gcgccagcag aatgccatag tgggcggtga cgtcgttcga 14040 
gtgaaccaga tcgcgcagga ggcccggcag caccggcata atcaggccga tgccgacagc 14100 
gtcgagcgcg acagtgctca gaattacgat caggggtatg ttgggtttca cgtctggcct 14160 
ccggaccagc ctccgctggt ccgattgaac gcgcggattc tttatcactg ataagttggt 14220 
ggacatatta tgtttatcag tgataaagtg tcaagcatga caaagttgca gccgaataca 14280 
gtgatccgtg ccgccctgga cctgttgaac gaggtcggcg tagacggtct gacgacacgc 14340 
aaactggcgg aacggttggg ggttcagcag ccggcgcttt actggcactt caggaacaag 14400 
cgggcgctgc tcgacgcact ggccgaagcc atgctggcgg agaatcatac gcattcggtg 14460 
ccgagagccg acgacgactg gcgctcattt ctgatcggga atgcccgcag cttcaggcag 14520 
gcgctgctcg cctaccgcga tggcgcgcgc atccatgccg gcacgcgacc gggcgcaccg 14580 
cagatggaaa cggccgacgc gcagcttcgc ttcctctgcg aggcgggttt ttcggccggg 14640 
gacgccgtca atgcgctgat gacaatcagc tacttcactg ttggggccgt gcttgaggag i4700 
caggccggcg acagcgatgc cggcgagcgc ggcggcaccg ttgaacaggc tccgctctcg 14760 
ccgctgttgc gggccgcgat agacgccttc gacgaagccg gtccggacgc agcgttcgag 14820 
cagggactcg cggtgattgt cgatggattg gcgaaaagga ggctcgttgt caggaacgtt 14880 
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gaaggaccga gaaagggtga cgattgatca ggaccgctgc cggagcgcaa cccactcact 14940 
acagcagagc catgtagaca acatcccctc cccctttcca ccgcgtcaga cgcccgtagc 15000 
agcccgctac gggctttttc atgccctgcc ctagcgtcca agcctcacgg ccgcgctcgg 15060 
cctctctggc ggccttctgg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 15120 
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 15180 
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 15240 
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 15300 
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 15360 
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 15420 
tgtccgcctt tctcccttcg ggaagcgtgg cgcttttccg ctgcataacc ctgcttcggg 15480 
gtcattatag cgattttttc ggtatatcca tcctttttcg cacgatatac aggattttgc 15540 
caaagggttc gtgtagactt tccttggtgt atccaacggc gtcagccggg caggataggt 15600 
gaagtaggcc cacccgcgag cgggtgttcc ttcttcactg tcccttattc gcacctggcg 15660 
gtgctcaacg ggaatcctgc tctgcgaggc tggccggcta ccgccggcgt aacagatgag 15720 
ggcaagcgga tggctgatga aaccaagcca accaggaagg gcagcccacc tatcaaggtg 15780 
tactgccttc cagacgaacg aagagcgatt gaggaaaagg cggcggcggc cggcatgagc 15840 
ctgtcggcct acctgctggc cgtcggccag ggctacaaaa tcacgggcgt cgtggactat 15900 
gagcacgtcc gcgagctggc ccgcatcaat ggcgacctgg gccgcctggg cggcctgctg 15960 
aaactctggc tcaccgacga cccgcgcacg gcgcggttcg gtgatgccac gatcctcgcc 16020 
ctgctggcga agatcgaaga gaagcaggac gagcttggca aggtcatgat gggcgtggtc 16080 
cgcccgaggg cagagccatg acttttttag ccgctaaaac ggccgggggg tgcgcgtgat 16140 
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tgccaagcac gtccccatgc gctccatcaa gaagagcgac ttcgcggagc tggtgaagta 16200 
catcaccgac gagcaaggca agaccgagcg cctttgcgac gctca 16245 

<210> 37 

<211> 17877 

<212> DNA 

<213> Artificial 

<220> 

<223> Promo tor 



<220> 

<221> misc_f eature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (10472) . • (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 

<400> 37 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 



caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 



360 
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gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 12 60 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 
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gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 
attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 
cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 
ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 
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agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3130 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 
tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 
acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 
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accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 
tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 
cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 
tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 
ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 
cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 
attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 
accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 
ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 
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cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatcfccg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 
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agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcuag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 
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ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 



WO 2004/063359 PCT/EP2004/000099 

103/357 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 103 80 
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tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt ttttcgagtt 10800 

tttttttttt ttctttgtga aggatttatt gttattggta tccatttttt attggaagac 10860 

aagataagtt aatattgatt ttgcttaaag attaaaagga aatcagaaaa cgacaataaa 10920 

aaatgtaacg gacaaactat ggtgtcgatt ataagtctaa atccttaaaa aatgacaacg 10980 

agttgctttc ctctgaaaac aattcttttg tctttgcaag aaaggtttct tttttgtttg 11040 

cttgcattac ttaaacatca aatcaaatga aaggaataaa gcagatttga gggcgaataa 11100 

ggattttctg gtcaacaaga tgtgagtgac acctaaggaa ctaaatgcca ttcatttgtt 11160 

ttaaaacgac atcaaagatt gatgatcaac aggattgaga gagagaaaaa gaactcgtgt 11220 

catttatttc tgttgactga aattttatat ttagaaaaaa tgtcaaatct atagctttag 11280 

ctatattaca taacatttga aataataata ataaaaaaag acacattaga gacacttttc 11340 

aaactctaaa taactgtcta taaacacaaa gaaaacaaag acctctataa caacttatta 11400 

gatttttctc gtacttttgt ctaaagatga tgtattcttg ttatcccaca cttctttcat 11460 

ttgttcttga tgctactaaa tatacaaaat ttcttttttg caagagatat tattccaaaa 11520 

attttcaaaa agaaattttt ttcacaatag cagttgatcg tgtaacccaa agaggttctt 11580 

tgttattttg cacttccgct ttgcggtgat gcatattcaa agtaatatat ggaataaaca 11640 
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acgtgtttaa gcatgaaaga aaggaaacaa aggccgcttt gaacaaatgc ataatatttc 11700 

agacaaaaat gatctaaagc aagcagtaaa tcaaacaaga aacattgctg attcgcgtta 11760 

gaaaacgata aaagtctaat aagccactaa gtatacttca atgaactttt tgtatgctta 11820 

tggtccaatc agaccaataa tttgtgacca ttcctgaggt ggctttggtg atgcggaaac 11880 

agaaaaaaat tttctcacca atcgatttaa aaaacaattt ctgctttgaa ccaaaacttt 11940 

ttttttctct ttaatcatta actttatcaa gtatgtacct accctcaaag tcctcactca 12000 

agcacaatta tgctaacatt gttccacctt ctctttagaa atgctgtcga agctgcagtc 12060 

aatcagcgtc aaggcccgcc gcgttgaact agcccgcgac atcacgcggc ccaaagtctg 12120 

cctgcatgct cagcggtgct cgttagttcg gctgcgagtg gcagcaccac agacagagga 12180 

ggcgctggga accgtgcagg ctgccggcgc gggcgatgag cacagcgccg atgtagcact 12240 

ccagcagctt gaccgggcta tcgcagagcg tcgtgcccgg cgcaaacggg agcagctgtc 12300 

ataccaggct gccgccattg cagcatcaat tggcgtgtca ggcattgcca tcttcgccac 12360 

ctacctgaga tttgccatgc acatgaccgt gggcggcgca gtgccatggg gtgaagtggc 12420 

tggcactctc ctcttggtgg ttggtggcgc gctcggcatg gagatgtatg cccgctatgc 12480 

acacaaagcc atctggcatg agtcgcctct gggctggctg ctgcacaaga gccaccacac 12540 

acctcgcact ggaccctttg aagccaacga cttgtttgca atcatcaatg gactgcccgc 12600 

catgctcctg tgtacctttg gcttctggct gcccaacgtc ctgggggcgg cctgctttgg 12660 

agcggggctg ggcatcacgc tatacggcat ggcatatatg tttgtacacg atggcctggt 12720 
gcacaggcgc tttcccaccg ggcccatcgc tggcctgccc tacatgaagc gcctgacagt 12780 
ggcccaccag ctacaccaca gcggcaagta cggtggcgcg ccctggggta tgttcttggg 12840 
tccacaggag ctgcagcaca ttccaggtgc ggcggaggag gtggagcgac tggtcctgga 12900 



WO 2004/063359 PCT/EP2004/000099 

106/357 

actggactgg tccaagcggt agaagcttgg cgtaatcatg gtcatagctg tttcctgtgt 12960 

gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 13020 

cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 13080 

tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc "gcggggagag 13140 

gcggtttgcg tattgggcca aagacaaaag ggcgacattc aaccgattga gggagggaag 13200 

gtaaatattg acggaaatta ttcattaaag gtgaattatc accgtcaccg acttgagcca 13260 

tttgggaatt agagccagca aaatcaccag tagcaccatt accattagca aggccggaaa 13320 

cgtcaccaat gaaaccatcg atagcagcac cgtaatcagt agcgacagaa tcaagtttgc 13380 

ctttagcgtc agactgtagc gcgttttcat cggcattttc ggtcatagcc cccttattag 13440 

cgtttgccat cttttcataa tcaaaatcac cggaaccaga gccaccaccg gaaccgcctc 13500 

cctcagagcc gccaccctca gaaccgccac cctcagagcc accaccctca gagccgccac 13560 

cagaaccacc accagagccg ccgccagcat tgacaggagg cccgatctag taacatagat 13 620 

gacaccgcgc gcgataattt atcctagttt gcgcgctata ttttgttttc tatcgcgtat 13680 

taaatgtata attgcgggac tctaatcata aaaacccatc tcataaataa cgtcatgcat 13740 

tacatgttaa ttattacatg cttaacgtaa ttcaacagaa attatatgat aatcatcgca 13800 

agaccggcaa caggattcaa tcttaagaaa ctttattgcc aaatgtttga acgatcgggg 13860 

atcatccggg tctgtggcgg gaactccacg aaaatatccg aacgcagcaa gatatcgcgg 13920 

tgcatctcgg tcttgcctgg gcagtcgccg ccgacgccgt tgatgtggac gccgggcccg 13980 

atcatattgt cgctcaggat cgtggcgttg tgcttgtcgg ccgttgctgt cgtaatgata 14040 

tcggcacctt cgaccgcctg ttccgcagag atcccgtggg cgaagaactc cagcatgaga 14100 
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tccccgcgct ggaggatcat ccagccggcg tcccggaaaa cgattccgaa gcccaacctt 14160 

tcatagaagg cggcggtgga atcgaaatct cgtgatggca ggttgggcgt cgcttggtcg 14220 

gtcatttcga accccagagt cccgctcaga agaactcgtc aagaaggcga tagaaggcga 14280 

tgcgctgcga atcgggagcg gcgataccgt aaagcacgag gaagcggtca gcccattcgc 14340 

cgccaagctc ttcagcaata tcacgggtag ccaacgctat gtcctgatag cggtccgcca 14400 

cacccagccg gccacagtcg atgaatccag aaaagcggcc attttccacc atgatattcg 14460 

gcaagcaggc atcgccatgg gtcacgacga gatcatcgcc gtcgggcatg cgcgccttga 14520 

gcctggcgaa cagttcggct ggcgcgagcc cctgatgctc ttcgtccaga tcatcctgat 14580 

cgacaagacc ggcttccatc cgagtacgtg ctcgctcgat gcgatgtttc gcttggtggt 14640 

cgaatgggca ggtagccgga tcaagcgtat gcagccgccg cattgcatca gccatgatgg 14700 

atactttctc ggcaggagca aggtgagatg acaggagatc ctgccccggc acttcgccca 14760 

atagcagcca gtcccttccc gcttcagtga caacgtcgag cacagctgcg caaggaacgc 14820 

ccgtcgtggc cagccacgat agccgcgctg cctcgtcctg cagttcattc agggcaccgg 14880 

acaggtcggt cttgacaaaa agaaccgggc gcccctgcgc tgacagccgg aacacggcgg 14940 

catcagagca gccgattgtc tgttgtgccc agtcatagcc . gaatagcctc tccacccaag 15000 

cggccggaga acctgcgtgc aatccatctt gttcaatcat gcgaaacgat ccagatccgg 15060 

tgcagattat ttggattgag agtgaatatg agactctaat tggataccga ggggaattta 15120 

tggaacgtca gtggagcatt tttgacaaga aatatttgct agctgatagt gaccttaggc i5180 

gacttttgaa cgcgcaataa tggtttctga cgtatgtgct tagctcatta aactccagaa 15240 

acccgcggct gagtggctcc ttcaacgttg cggttctgtc agttccaaac gtaaaacggc 15300 

ttgtcccgcg tcatcggcgg gggtcataac gtgactccct taattctccg ctcatgatca 15360 
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gattgtcgtt tcccgccttc agtttaaact atcagtgttt gacaggatat attggcgggt 15420 

aaacctaaga gaaaagagcg tttattagaa taatcggata tttaaaaggg cgtgaaaagg 15480 

tttatccgtt cgtccatttg tatgtgcatg ccaaccacag ggttccccag atctggcgcc 15540 

ggccagcgag acgagcaaga ttggccgccg cccgaaacga tccgacagcg cgcccagcac 15600 

aggt^cgcag gcaaattgca ccaacgcata cagcgccagc agaatgccat agtgggcggt 15660 

gacgtcgttc gagtgaacca gatcgcgcag gaggcccggc agcaccggca taatcaggcc 15720 

gatgccgaca gcgtcgagcg cgacagtgct cagaattacg atcaggggta tgttgggttt 15780 

cacgtctggc ctccggacca gcctccgctg gtccgattga acgcgcggat tctttatcac 15840 

tgataagttg gtggacatat tatgtttatc agtgataaag tgtcaagcat gacaaagttg 15900 

cagccgaata cagtgatccg tgccgccctg gacctgttga acgaggtcgg cgtagacggt 15960 

ctgacgacac gcaaactggc ggaacggttg ggggttcagc agccggcgct ttactggcac 16020 

ttcaggaaca agcgggcgct gctcgacgca ctggccgaag ccatgctggc ggagaatcat 16080 

acgcattcgg tgccgagagc cgacgacgac tggcgctcat ttctgatcgg gaatgcccgc 16140 

agcttcaggc aggcgctgct cgcctaccgc gatggcgcgc gcatccatgc cggcacgcga 16200 

ccgggcgcac cgcagatgga aacggccgac gcgcagcttc gcttcctctg cgaggcgggt 16260 

ttttcggccg gggacgccgt caatgcgctg atgacaatca gctacttcac tgttggggcc 16320 

gtgcttgagg agcaggccgg cgacagcgat gccggcgagc gcggcggcac cgttgaacag 16380 

gctccgctct cgccgctgtt gcgggccgcg atagacgcct tcgacgaagc cggtccggac 16440 

gcagcgttcg agcagggact cgcggtgatt gtcgatggat tggcgaaaag gaggctcgtt 16500 

gtcaggaacg ttgaaggacc gagaaagggt gacgattgat caggaccgct gccggagcgc 16560 

aacccactca ctacagcaga gccatgtaga caacatcccc tccccctttc caccgcgtca 16620 



WO 2004/063359 PCT/EP2004/000099 

109/357 

gacgcccgta gcagcccgct acgggctttt tcatgccctg ccctagcgtc caagcctcac 16680 

ggccgcgctc ggcctctctg gcggccttct ggcgctcttc cgcttcctcg ctcactgact 16740 

cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 16800 

ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 16860 

aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 16920 

acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 16980 

gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 17040 

ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgcttttc cgctgcataa 17100 

ccctgcttcg gggtcattat agcgattttt tcggtatatc catccttttt cgcacgatat 17160 

acaggatttt gccaaagggt tcgtgtagac tttccttggt gtatccaacg gcgtcagccg 17220 

ggcaggatag gtgaagtagg cccacccgcg agcgggtgtt ccttcttcac tgtcccttat 17280 

tcgcacctgg cggtgctcaa cgggaatcct gctctgcgag gctggccggc taccgccggc 17340 

gtaacagatg agggcaagcg gatggctgat gaaaccaagc caaccaggaa gggcagccca 17400 

cctatcaagg tgtactgcct tccagacgaa cgaagagcga ttgaggaaaa ggcggcggcg 17460 

gccggcatga gcctgtcggc ctacctgctg gccgtcggcc agggctacaa aatcacgggc 17520 

gtcgtggact atgagcacgt ccgcgagctg gcccgcatca atggcgacct gggccgcctg 17580 

ggcggcctgc tgaaactctg gctcaccgac gacccgcgca cggcgcggtt cggtgatgcc 17640 
acgatcctcg ccctgctggc gaagatcgaa gagaagcagg acgagcttgg caaggtcatg 17700 

4 

atgggcgtgg tccgcccgag ggcagagcca tgactttttt agccgctaaa acggccgggg 17760 
ggtgcgcgtg attgccaagc acgtccccat gcgctccatc aagaagagcg acttcgcgga 17820 
gctggtgaag tacatcaccg acgagcaagg caagaccgag cgcctttgcg acgctca 17877 
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<210> 38 

<211> 17238 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_f eature 

<222> (10264) (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> mi sc_f eature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 

<400> 38 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 



tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 
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ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 12 60 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 13 80 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 
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tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta * 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 
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cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 
ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 
tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 
acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 
tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 
acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 
accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 
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gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 
ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 
cgctgtgcag ccgctgatgg tcgtgttcat ctdtgccgct ctgctaggta gcccgatacg 5220 
attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 
accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 
ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 
cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 
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gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 57 60 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 63 60 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 
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tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

jgtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gfcgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 
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cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 87 60 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 
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tgtcacgttg caagacctgc ctgaaaccga 
ggccatggat gcgatcgctg cggccgatct 
accgcaagga atcggtcaat acactacatg 
ccatgtgtat cactggcaaa ctgtgatgga 
tctcgatgag ctgatgcttt gggccgagga 
ggatttcggc tccaacaatg tcctgacgga 
gagcgaggcg atgttcgggg attcccaata 
gtggttggct tgtatggagc agcagacgcg 
aggatcgccg cggctccggg cgtatatgct 
cttggttgac ggcaatttcg atgatgcagc 
ccgatccgga gccgggactg tcgggcgtac 
gaccgatggc tgtgtagaag tactcgccga 
gagggcaaag gaatagagta gatgccgacc 
tcatcaaaca gcttgacgaa tctggatata 
ttgagacaaa tggtgttcag gatctcgata 
gtgccttcta gtgatttaat agctccatgt 
cctcttccag atacagctca tctgcaatgc 
cttncaggct ccggcgaaga gaagaatagc 
gagatcaagc agatcaacgg tcgtcaagag 
tccacgcgac tatatatttg tctctaattg 
atagcttgac tatgaaaatt ccgtcaccag 
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actgcccgct gttctgcagc cggtcgcgga 9300 

tagccagacg agcgggttcg gcccattcgg 9360 

gcgtgatttc atatgcgcga ttgctgatcc 9420 

cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

ctgccccgaa gtccggcacc tcgtgcacgc 9540 

caatggccgc ataacagcgg tcattgactg 9600 

cgaggtcgcc aacatcttct tctggaggcc 9660 

ctacttcgag cggaggcatc cggagcttgc 9720 

ccgcattggt cttgaccaac tctatcagag 9780 

ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

acaaatcgcc cgcagaagcg cggccgtctg 9900 

tagtggaaac cgacgcccca gcactcgtcc 9960 

gcgggatcga tccacttaac gttactgaaa 10020 

agatcgttgg tgtcgatgtc agctccggag 10080 

agatacgttc atttgtccaa gcagcaaaga 10140 

caacaagaat aaaacgcgtt ttcgggttta 10200 

attaatgcat tgactgcaac ctagtaacgc 10260 

ttagcagagc tattttcatt ttcgggagac 10320 

acctacgaga ctgaggaatc cgctcttggc 10380 

tactttgaca tgctcctctt ctttactctg 10440 

cncctgggtt cgcaaagata attgcatgtt 10500 
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tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt ctaccgcttg 10800 

gaccagtcca gttccaggac cagtcgctcc acctcctccg ccgcacctgg aatgtgctgc 10860 

agctcctgtg gacccaagaa cataccccag ggcgcgccac cgtacttgcc gctgtggtgt 10920 

agctggtggg ccactgtcag gcgcttcatg tagggcaggc cagcgatggg cccggtggga 10980 

aagcgcctgt gcaccaggcc atcgtgtaca aacatatatg ccatgccgta tagcgtgatg 11040 

cccagccccg ctccaaagca ggccgccccc aggacgttgg gcagccagaa gccaaaggta 11100 

cacaggagca tggcgggcag tccattgatg attgcaaaca agtcgttggc ttcaaagggt 11160 

ccagtgcgag gtgtgtggtg gctcttgtgc agcagccagc ccagaggcga ctcatgccag 11220 

atggctttgt gtgcatagcg ggcatacatc tccatgccga gcgcgccacc aaccaccaag 11280 

aggagagtgc cagccacttc accccatggc actgcgccgc ccacggtcat gtgcatggca 11340 

aatctcaggt aggtggcgaa gatggcaatg cctgacacgc caattgatgc tgcaatggcg 11400 

gcagcctggt atgacagctg ctcccgtttg cgccgggcac gacgctctgc gatagcccgg 11460 

tcaagctgct ggagtgctac atcggcgctg tgctcatcgc ccgcgccggc agcctgcacg 11520 

gttcccagcg cctcctctgt ctgtggtgct gccactcgca gccgaactaa cgagcaccgc 11580 

tgagcatgca ggcagacttt gggccgcgtg atgtcgcggg ctagttcaac gcggcgggcc 11640 

ttgacgctga ttgactgcag cttcgacagc atagagataa aataaaaaga gaagaaaaga 11700 

aagtttgtac aatttctttt tgtttatata acatacacgc tatgtcaaca tttagaataa 11760 
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gggggaaaaa atcttccatc atattcgaat gcacaagatt atttctttgt tcgctctttt 11820 
tggtcgggtc atcgagattt agagtgtaat caaagatact gtcatctcga gagcgttgca 11880 
caggctgctg tttgccaaat tggatgtttg ccgaattagt aaaatacgca agcatttctt 11940- 
acctttccgc tcccttttcc taattctccc aaagactaaa tgaggaaaga taaaggacaa 12000 
agaaaatgta aagacaaaga aattgaaaac gatataaact tgcagcacgt aagaccaaag 12060 
caaattggta actattcttg tgtacaaaca tgtataaaaa aaaacttttt tttgctcctg 12120 
gaggacaaaa tttcaaactc cttgaagaag attgcttgta tatctatcat atgcatatat 12180 
catatcgatg gaaaaagaaa gtcaggcatg tatttataaa aagaagaatg tgccatgctt 12240 
ccgaatttct tttcactttc ttttccttat ctattttaat ctcaagcttg gcgtaatcat 12300 
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 12360 
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 12420 
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 12480 
tcggccaacg cgcggggaga ggcggtttgc gtattgggcc aaagacaaaa gggcgacatt 12540 
caaccgattg agggagggaa ggtaaatatt gacggaaatt attcattaaa ggtgaattat 12600 
caccgtcacc gacttgagcc atttgggaat tagagccagc aaaatcacca gtagcaccat 12660 
taccattagc aaggccggaa acgtcaccaa tgaaaccatc gatagcagca ccgtaatcag 12720 
tagcgacaga atcaagtttg cctttagcgt cagactgtag cgcgttttca tcggcatttt 12780 
cggtcatagc ccccttatta gcgtttgcca tcttttcata atcaaaatca ccggaaccag 12840 
agccaccacc ggaaccgcct ccctcagagc cgccaccctc agaaccgcca ccctcagagc 12900 
caccaccctc agagccgcca ccagaaccac caccagagcc gccgccagca ttgacaggag 12960 
gcccgatcta gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat 13020 
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attttgtttt ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat 13080 
ctcataaata acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga 13140 
aattatatga taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc 13200 
caaatgtttg aacgatcggg gatcatccgg gtctgtggcg ggaactccac gaaaatatcc 13260 
gaacgcagca agatatcgcg gtgcatctcg gtcttgcctg ggcagtcgcc gccgacgccg 13320 
ttgatgtgga cgccgggccc gatcatattg tcgctcagga tcgtggcgtt gtgcttgtcg 13380 
gccgttgctg tcgtaatgat atcggcacct tcgaccgcct gttccgcaga gatcccgtgg 13440 
gcgaagaact ccagcatgag atccccgcgc tggaggatca tccagccggc gtcccggaaa 13500 
acgattccga agcccaacct ttcatagaag gcggcggtgg aatcgaaatc tcgtgatggc 13560 
aggttgggcg tcgcttggtc ggtcatttcg aaccccagag tcccgctcag aagaactcgt 13 620 
caagaaggcg atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga 13680 
ggaagcggtc agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta 13740 
tgtcctgata gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc 13800 
cattttccac catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcatcgc 13 860 
cgtcgggcat gcgcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct 13920 
cttcgtccag atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga 13980 
tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc 14040 
gcattgcatc agccatgatg gatactttct cggcaggagc aaggtgagat gacaggagat 14100 
cctgccccgg cacttcgccc aatagcagcc agtcccttcc cgcttcagtg acaacgtcga 14160 
gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga tagccgcgct gcctcgtcct 14220 
gcagttcatt cagggcaccg gacaggtcgg tcttgacaaa aagaaccggg cgcccctgcg 142 80 
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ctgacagccg gaacacggcg gcatcagagc agccgattgt ctgttgtgcc cagtcatagc 14340 
cgaatagcct ctccacccaa gcggccggag aacctgcgtg caatccatct tgttcaatca 14400 
tgcgaaacga tccagatccg gtgcagatta tttggattga gagtgaatat gagactctaa 14460 
ttggataccg aggggaattt atggaacgtc agtggagcat ttttgacaag aaatatttgc 14520 
tagctgatag tgaccttagg cgactfcttga acgcgcaata atggtttctg acgtatgtgc 14580 
ttagctcatt aaactccaga aacccgcggc tgagtggctc cttcaacgtt gcggttctgt 14640 
cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 14700 
ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac tatcagtgtt 14760 
tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat 14820 
atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 14880 
gggttcccca gatctggcgc cggccagcga gacgagcaag attggccgcc gccegaaacg 14940 
atccgacagc gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag 15000 
cagaatgcca tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg 15060 
cagcaccggc ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac 15120 
gatcaggggt atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg 15180 
aacgcgcgga ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa 15240 
gtgtcaagca tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg 15300 
aacgaggtcg gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag 15360 
cagccggcgc tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa 15420 
gccatgctgg cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca 15480 
tttctgatcg ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg 15540 
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cgcatccatg ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt 15600 
cgcttcctct gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc 15660 
agctacttca ctgttggggc cgtgcttgag gagcaggccg gcgacagcga tgccggcgag 15720 
cgcggcggca ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc 15780 
ttcgacgaag ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga 15840 
ttggcgaaaa ggaggctcgt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga 15900 
tcaggaccgc tgccggagcg caacccactc actacagcag agccatgtag acaacatccc 15960 
ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct 16020 
gccctagcgt ccaagcctca cggccgcgct cggcctctct ggcggccttc tggcgctctt 16080 
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16140 
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16200 
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16260 
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16320 
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 16380 
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 16440 
tggcgctttt ccgctgcata accctgcttc ggggtcatta tagcgatttt ttcggtatat 16500 
ccatcctttt tcgcacgata tacaggattt tgccaaaggg ttcgtgtaga ctttccttgg 16560 
tgtatccaac ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggtgt 16620 
tccttcttca ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga 16680 
ggctggccgg ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag 16740 
ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg 16800 
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attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc 16860 

cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc 16920 

aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc 16980 

acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag 17040 

gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt 17100 

tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat 17160 

caagaagagc gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga 17220 

1723 8 

gcgcctttgc gacgctca 
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<400> 39 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 



60 



aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 
ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 
ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 
gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 
agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 
ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 



1200 



1260 
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ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 
atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 
agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 
agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 
cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 
ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 
gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 
gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 
tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 
ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 
tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 
tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 
ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 
aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 
aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 
ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 
aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 
taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 
tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 
tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 
catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 
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tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 
tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 
tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 
attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 
cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 
ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 
agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 
cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 
tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 
attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 
tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 
ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 
cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 
gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 
gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 
ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 
aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 
gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 
tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 
agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 
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tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

* 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 
ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 
gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 
tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 
ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 
gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 
catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 
tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 
cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 
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tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 
cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 
tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 
cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 
caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 
gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 
taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 
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aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 
'cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 
ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 
agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 
cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 
tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 
ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 
cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 
gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 
gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 
aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 
aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 
aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 
cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 
tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 
tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 
tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 
tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 
gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 
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tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 
tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 
gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 
atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 
cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 
ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 
tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 
cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 
tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 
acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 
cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 
agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 
gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 
atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 
gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 
ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 
cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 
tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 
aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 
cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 
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tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 
aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 
cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 
tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
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ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt agagataaaa 10800 
taaaaagaga agaaaagaaa gtttgtacaa tttctttttg tttatataac atacacgcta 10860 
tgtcaacatt tagaataagg gggaaaaaat cttccatcat attcgaatgc acaagattat 10920 
ttctttgttc gctctttttg gtcgggtcat cgagatttag agtgtaatca aagatactgt 10980 
catctcgaga gcgttgcaca ggctgctgtt tgccaaattg gatgtttgcc gaattagtaa 11040 
aatacgcaag catttcttac ctttccgctc ccttttccta attctcccaa agactaaatg 11100 
aggaaagata aaggacaaag aaaatgtaaa gacaaagaaa ttgaaaacga tataaacttg 11160 
cagcacgtaa gaccaaagca aattggtaac tattcttgtg tacaaacatg tataaaaaaa 11220 
aacttttttt tgctcctgga ggacaaaatt tcaaactcct tgaagaagat tgcttgtata 11280 
tctatcatat gcatatatca tatcgatgga aaaagaaagt caggcatgta tttataaaaa 11340 
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gaagaatgtg ccatgcttcc gaatttcttt tcactttctt ttccttatct attttaatct 11400 
catgctgtcg aagctgcagt caatcagcgt caaggcccgc cgcgttgaac tagcccgcga 11460 
catcacgcgg cccaaagtct gcctgcatgc tcagcggtgc tcgttagttc ggctgcgagt 11520 
ggcagcacca cagacagagg aggcgctggg aaccgtgcag gctgccggcg cgggcgatga 11580 
gcacagcgcc gatgtagcac tccagcagct tgaccgggct atcgcagagc gtcgtgcccg 11640 
gcgcaaacgg gagcagctgt cataccaggc tgccgccatt gcagcatcaa ttggcgtgtc 11700 
aggcattgcc atcttcgcca cctacctgag atttgccatg cacatgaccg tgggcggcgc 11760 
agtgccatgg ggtgaagtgg ctggcactct cctcttggtg gttggtggcg cgctcggcat 11820 
ggagatgtat gcccgctatg cacacaaagc catctggcat gagtcgcctc tgggctggct 11880 
gctgcacaag agccaccaca cacctcgcac tggacccttt gaagccaacg acttgtttgc 11940 
aatcatcaat ggactgcccg ccatgctcct gtgtaccttt ggcttctggc tgcccaacgt 12000 
cctgggggcg gcctgctttg gagcggggct gggcatcacg ctatacggca tggcatatat 12060 
gtttgtacac gatggcctgg tgcacaggcg ctttcccacc gggcccatcg ctggcctgcc 12120 
ctacatgaag cgcctgacag tggcccacca gctacaccac agcggcaagt acggtggcgc 12180 
gccctggggt atgttcttgg gtccacagga gctgcagcac attccaggtg cggcggagga 12240 
ggtggagcga ctggtcctgg aactggactg gtccaagcgg tagaagcttg gcgtaatcat 12300 
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 12360 
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 12420 
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 12480 
tcggccaacg cgcggggaga ggcggtttgc gtattgggcc aaagacaaaa gggcgacatt 12540 
caaccgattg agggagggaa ggtaaatatt gacggaaatt attcattaaa ggtgaattat 12600 
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caccgtcacc gacttgagcc atttgggaat tagagccagc aaaatcacca gtagcaccat 12660 
taccattagc aaggccggaa acgtcaccaa tgaaaccatc gatagcagca ccgtaatcag 12720' 
tagcgacaga atcaagtttg cctttagcgt cagactgtag cgcgttttca tcggcatttt 12780 
cggtcatagc ccccttatta gcgtttgcca tcttttcata atcaaaatca ccggaaccag 12840 
agccaccacc ggaaccgcct ccctcagagc cgccaccctc agaaccgcca ccctcagagc 12900 
caccaccctc agagccgcca ccagaaccac caccagagcc gccgccagca ttgacaggag 12960 
gcccgatcta gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat 13020 
attttgtttt ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat 13080 
ctcataaata acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga 13140 
aattatatga taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc 13200 
caaatgtttg aacgatcggg gatcatccgg gtctgtggcg ggaactccac gaaaatatcc 13260 
gaacgcagca agatatcgcg gtgcatctcg gtcttgcctg ggcagtcgcc gccgacgccg 13320 
ttgatgtgga cgccgggccc gatcatattg tcgctcagga tcgtggcgtt gtgcttgtcg 13380 
gccgttgctg tcgtaatgat atcggcacct tcgaccgcct gttccgcaga gatcccgtgg 13440 
gcgaagaact ccagcatgag atccccgcgc tggaggatca tccagccggc gtcccggaaa 13500 
acgattccga agcccaacct ttcatagaag gcggcggtgg aatcgaaatc tcgtgatggc 13560 
aggttgggcg tcgcttggtc ggtcatttcg aaccccagag tcccgctcag aagaactcgt 13620 
caagaaggcg atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga 13680 
ggaagcggtc agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta 13740 
tgtcctgata gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc 13800 
cattttccac catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcatcgc 13860 
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cgtcgggcat gcgcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct 13920 
cttcgtccag atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga 13980 
tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc 14040 
gcattgcatc agccatgatg gatactttct cggcaggagc aaggtgagat gacaggagat 14100 
cctgccccgg cacttcgccc aatagcagcc agtcccttcc cgcttcagtg acaacgtcga 14160 
gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga tagccgcgct gcctcgtcct 14220 
gcagttcatt cagggcaccg gacaggtcgg tcttgacaaa aagaaccggg cgcccctgcg 14280 
ctgacagccg gaacacggcg gcatcagagc agccgattgt ctgttgtgcc cagtcatagc 14340 
cgaatagcct ctccacccaa gcggccggag aacctgcgtg caatccatct tgttcaatca 14400 
tgcgaaacga tccagatccg gtgcagatta tttggattga gagtgaatat gagactctaa 14460 
ttggataccg aggggaattt atggaacgtc agtggagcat ttttgacaag aaatatttgc 14520 
tagctgatag tgaccttagg cgacttttga acgcgcaata atggtttctg acgtatgtgc 14580 
ttagctcatt aaactccaga aacccgcggc tgagtggctc cttcaacgtt gcggttctgt 14640 
cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 14700 
ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac tatcagtgtt 14760 
tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat 14820 
atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 14880 
gggttcccca gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg 14940 
atccgacagc gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag 15000 
cagaatgcca tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg 15060 
cagcaccggc ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac 15120 
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gatcaggggt atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg 15180 
aacgcgcgga ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa 15240 
gtgtcaagca tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg 15300 
aacgaggtcg gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag 15360 
cagccggcgc tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa 15420 
gccatgctgg cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca 15480 
tttctgatcg ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg 15540 
cgcatccatg ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt 15600 
cgcttcctct gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc 15660 
agctacttca ctgttggggc cgtgcttgag gagcaggccg gcgacagcga tgccggcgag 15720 
cgcggcggca ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc 15780 
ttcgacgaag ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga 15840 
ttggcgaaaa ggaggctcgt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga 15900 
tcaggaccgc tgccggagcg caacccactc actacagcag agccatgtag acaacatccc 15960 
ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct 16020 
gccctagcgt ccaagcctca cggccgcgct cggcctctct ggcggccttc tggcgctctt 16080 
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16140 
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16200 
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16260 
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16320 
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 16380 
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ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 16440 
tggcgctttt ccgctgcata accctgcttc ggggtcatta tagcgatttt ttcggtatat 16500 
ccatcctttt tcgcacgata tacaggattt tgccaaaggg ttcgtgtaga ctttccttgg 16560 
tgtatccaac ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggtgt 16620 
tccttcttca ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga 16680 
ggctggccgg ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag 16740 
ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg 16800 
attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc 16860 
cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc 16920 
aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc 16980 
acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag 17040 
gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt 17100 
tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat 17160 
caagaagagc gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga 17220 

17238 

gcgcctttgc gacgctca 
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<221> misc_feature 

<222> (3471) .. (3471) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3679) .. (3679) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3770) .. (3770) 

<223> n is a, c, g, or t 



<400> 40 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 



60 



cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 
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caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 
cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 
ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 
aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 
tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 
cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 
ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 
aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 
tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 
tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 
ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 
agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 
tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 
taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 
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gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 
ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 
aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 
gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 
gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 . 
tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 
tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 
tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 
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atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 
cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 
gcgaagagaa gaatagctta gcagagctat tbtcattttc gggagacgag atcaagcaga 3540 
tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 
atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 
gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 
ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 
gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840- 
gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 
cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 
ctccacatct ccactcgacc tgcaggcatg caaagcttga gattaaaata gataaggaaa 4020 
agaaagtgaa aagaaattcg gaagcatggc acattcttct ttttataaat acatgcctga 4080 
ctttcttttt ccatcgatat gatatatgca tatgatagat atacaagcaa tcttcttcaa 4140 
ggagtttgaa attttgtcct ccaggagcaa aaaaaagttt ttttttatac atgtttgtac 4200 
acaagaatag ttaccaattt gctttggtct fcacgtgctgc aagtttatat cgttttcaat 4260 
ttctttgtct ttacattttc tttgtccttt atctttcctc atttagtctt tgggagaatt 4320 
aggaaaaggg agcggaaagg taagaaatgc ttgcgtattt tactaattcg gcaaacatcc 4380 
aatttggcaa acagcagcct gtgcaacgct ctcgagatga cagtatcttt gattacactc 4440 
taaatctcga tgacccgacc aaaaagagcg aacaaagaaa taatcttgtg cattcgaata 4500 
tgatggaaga ttttttcccc cttattctaa atgttgacat agcgtgtatg ttatataaac 4560 
aaaaagaaat tgtacaaact ttcttttctt ctctttttat tttatctcta tgctgtcgaa 4620 
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gctgcagtca atcagcgtca aggcccgccg cgttgaacta gcccgcgaca tcacgcggcc 4680 

caaagtctgc ctgcatgctc agcggtgctc gttagttcgg ctgcgagtgg cagcaccaca 4740 

gacagaggag gcgctgggaa ccgtgcaggc tgccggcgcg ggcgatgagc acagcgccga 4800 

tgtagcactc cagcagcttg accgggctat cgcagagcgt cgtgcccggc gcaaacggga 4860 

gcagctgtca taccaggctg ccgccattgc agcatcaatt ggcgtgtcag gcattgccat 4920 
cttcgccacc tacctgagat ttgccatgca catgaccgtg ggcggcgcag tgccatgggg ' 4980 

tgaagtggct ggcactctcc tcttggtggt tggtggcgcg ctcggcatgg agatgtatgc 5040 

ccgctatgca cacaaagcca tctggcatga gtcgcctctg ggctggctgc tgcacaagag 5100 

ccaccacaca cctcgcactg gaccctttga agccaacgac ttgtttgcaa tcatcaatgg 5160 

actgcccgcc atgctcctgt gtacctttgg cttctggctg cccaacgtcc tgggggcggc 5220 

ctgctttgga gcggggctgg gcatcacgct atacggcatg gcatatatgt ttgtacacga 5280 

tggcctggtg cacaggcgct ttcccaccgg gcccatcgct ggcctgccct acatgaagcg 5340 

cctgacagtg gcccaccagc tacaccacag cggcaagtac ggtggcgcgc cctggggtat 5400 

gttcttgggt ccacaggagc tgcagcacat tccaggtgcg gcggaggagg tggagcgact 5460 

ggtcctggaa ctggactggt ccaagcggta gattgtgact gatagcgaga ctctgggtcg 5520 

atgttatctg cctcaacaat ggcttagaaa agaagaaaca gaacaaatac agcaaggcaa 5580 

cgcccgtagc ctaggtgatc aaagactgtt gggcttgtct ctgaagcttg taggaaaggc 5640 

agacgctatc atggtgagag ctaagaaggg cattgacaag ttgccggcaa actgtcaagg 5700 
cggtgtacga gctgcttgcc aagtatatgc tgcaattgga tctgtactca agcagcagaa 5760 
gacaacatat cctacaagag ctcatctaaa aggaagcgaa cgtgccaaga ttgctctgtt 5820 
gagtgtatac aacctctatc aatctgaaga caagcctgtg gctctccgtc aagctagaaa 5880 
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gattaagagt ttttttgttg attagtgaat ttttgtttta tttatgtctg atagttcaat 5940 
aaagagacaa cacatacaat ataaaatcat tgtctttaaa tgttaattta gtagagtgta 6000 
aagcctgcat tttttttgta cgcataaaca atgaattcac cccgcttctg gtttttaaat 6060 
aattatgtca aactagggaa aattcttttt tttctcttcg ttcttttttt ggcttgttgt 6120 
ggagtcacag gcttgtcttc agattgatag aggttgtata cactcaacag agcaatcttg 6180 
gcacgttcgc ttccttttag atgagctctt gtaggatatg ttgtcttctg ctgcttgagt 6240 
acagatccaa ttgcagcata tacttggcaa gcagctcgta caccgccttg acagtttgcc 6300 
ggcaacttgt caatgccctt cttagctctc accatgatag cgtctgcctt tcctacaagc 6360 
ttcagagaca agcccaacag tctttgatca cctaggctac gggcgttgcc ttgctgtatt 6420 
tgttctgttt cttcttttct aagccattgt tgaggcagat aacatcgacc caacatcctc 6480 
gagccatact acagcataaa aggatacgtt ttctttaaca gaaatttacc cttttgttat 6540 
cagcacatac aaaaaaaaag aaatttaaga tgagtaggac ttccattctc tcaaaaattt 6600 
tattcaatcc ataaatgaat tatttttgga caaaaaagaa agattatgcc tgattttctc 6660 
tatttttttt ttttttacaa ctccaccaat actttctagc ccagcttggc gtaatcatgg 6720 
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 6780 
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 6840 
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6900 
ggccaacgcg cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca 6960 
accgattgag ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca 7020 
ccgtcaccga cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta 7080 
ccattagcaa ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta 7140 
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gcgacagaat caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg 7200 

gtcatagccc ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag 7260 

ccaccaccgg aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca 7320 

ccaccctcag agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc 7380 

ccgatctagt aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat 7440 

tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct 7500 

cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa 7560 

ttatatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca 7620 

aatgtttgaa cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga 7 680 

acgcagcaag atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt 7740 

gatgtggacg ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc 7800 

cgttgctgtc gtaatgatat cggcaccttc gaccgcctgt tccgcagaga toccgtgggc 7860 

gaagaactcc agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac 7920 

gattccgaag cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag 7980 

gttgggcgtc gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca 8040 

agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 8100 

aagcggtcag cccattcgcc gccaagctct. tcagcaatat cacgggtagc caacgctatg 8160 

tcctgatagc ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca 8220 

ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg 8280 

tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct 8340 
tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg 8400 
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cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 8460 

attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc 8520 

tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc 8580 

acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc 8640 

agttcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct 8700 

gacagccgga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg 8760 

aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 8820 

cgaaacgatc cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt 8880 

ggataccgag gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta 8940 

gctgatagtg accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt 9000 

agctcattaa actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca 9060 

gttccaaacg taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt 9120 1 

aattctccgc tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 9180 

acaggatata ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat 9240 

ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 9300 

gttccccaga tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat 9360 

ccgacagcgc gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca 9420 

gaatgccata gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca 9480 

gcaccggcat aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga 9540 

tcaggggtat gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa 9600 

cgcgcggatt ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt 9660 
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gtcaagcatg acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa 9720 
cgaggtcggc gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca 9780 
gccggcgctt tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc 9840 
catgctggcg gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt 9900 
tctgatcggg aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg 9960 
catccatgcc ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg 10020 
cttcctctgc gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag 10080 
ctacttcact gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg 10140 
cggcggcacc gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt 10200 
cgacgaagcc ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt 10260 
ggcgaaaagg aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc 10320 
aggaccgctg ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct 10380 
ccccctttcc accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc 10440 
cctagcgtcc aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc 10500. 
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 10560 
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 10620 
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 10680 
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 10740 
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 10800 
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 10860 
gcgcttttcc gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc 10920 
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atcctttttc gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg 10980 
tatccaacgg cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc 11040 
cttcttcact gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg 11100 
ctggccggct accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc 11160 
aaccaggaag ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat 11220 
tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca 11280 
gggctacaaa atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa 11340 
tggcgacctg ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac 11400 
ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga 11460 
cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta 11520 
gccgctaaaa cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca 11580 
agaagagcga cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc 11640 
gcctttgcga cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc 11700 
cctgcaaacg cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt 11760 
tgtggatacc tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact 11820 
tgaggggccg actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg 11880 
gcgacgtgga gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc 11940 
ccacagatga tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc 12000 
gcgactactg acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga 12060 
tgaggggcgc acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc 12120 
aagggtttcc gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca 12180 
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atatttataa accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg 12240 
aaggggggtg cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc 12300 
ccaggggctg cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt 12360 
ccttgccatt gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc 12420 
cggaagcatt gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag 12480 
tgagggcggc ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga 12540 
cttcatggcg gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc 12600 
cgtgctcgtg ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt 12660 
ataccgaggt atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat 12720 
ttaaaaagct accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat 12780 
attgacaata ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga 12840 
tttcaggggg caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca 12900 
taaaaacttg catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt 12960 
ctatcataat tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc 13020 
gatgactttg tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg 13080 
tgccaggtgc tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct 13140 
gattacgtgc agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca 13200 
tatcaccacg tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg 13260 
ttcaccgaat acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca 13320 
gcgctggcgc gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat 13380 
gacgtcactg cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga 13440 
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cgtaaaatcg tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca 13500 
ttcatggcca tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac 13560 
tgcagttgcc atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt 13620 
ttgccgttac gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa 13680 . 
gccactggag cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc 13740 
cataattgtg gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac 13800 
aactttgaaa aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg 13860 
gagttcgtct tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa 13920 
ggaaataata aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat 13980 
accgctgcgt aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag 14040 
aaaatgaaaa cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg 14100 
tggaacggga aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc 14160 
tgcactttga acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc 14220 
tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg 14280 
agtgcatcag gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag 14340 
acagccgctt agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg 14400 
aaaactggga agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga 14460 
cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct 14520 
ttgtgaaaga tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca 14580 
agtggtatga cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt 14640 
atgtcgagct attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt 14700 



WO 2004/063359 PCT/EP2004/000099 

151/357 

atattttact ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag 14760 
caggagcgca ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc 14820 
aagtatttgg gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac 14880 
gagaaggacg gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg 14940 
gacaccaagg caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc 15000 
ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg accggaaggc ata'caggcaa 15060 
gaactgatcg acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc 15120 . 
atgcgtgcgc cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc 15180 
aagatcgagc gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc 15240 
gtggagcgtt cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc 15300 
gacacgcgag gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa 15360 
caggtcagcg aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa 15420 
atgcagcttt ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac 15480 
gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg 15540 
caaaacaagg tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag 15600 
ctgcgggccg acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc 15660 
cctatcggcg agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg 15720 
atcaatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg 15780 
atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc 15840 
cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 15900 
gtcgtgctgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg 15960 
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tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc 16020 
aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 16080 
gagcaggtcg gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg 16140 
gtcaatgatg acctggtgca t.tgcaaacgc tagggccttg tggggtcagt tccggctggg 16200 
ggttcagcag ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact 16260 
tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag 16320 
gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg g'ccgacgtgc 16380 
aggatttccg cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg 16440 
tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg 16500 
tggcattcgg cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg 16560 
acggccccaa ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc 16620 
gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga 16680 
tgatcgtccg acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac 16740 
ttaatatttc gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg 16800 
tcgcggcgac ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc 16860 
taggtagccc gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg 16920 
cgctgttggt gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg 16980 
cgggggcggt ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc 17040 
ctctgctcac ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag 17100 
ctttagtgtt tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt 17160 
ggctcggcct gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac 17220 
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tcgaacctac agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc 17280 
cggggatgca tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag 17340 
caatggatag gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc 17400 
ttcctcagcg gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca 17460 
gcctgtcacg gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg 17520 
agatgatatt tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 17580 
ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc 17 640 
ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact 17700 
gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 17760 
ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac 17820 
acattgcgga cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa 17880 
cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 17940 
ttgccccagc aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat 18000 
aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 18060 
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 18120 
ccactacgtg aaccatcacc caaafccaagt tttttggggt cgaggtgccg taaagcacta 18180 
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 18240 
gcgagaaagg aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg 18300 
ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 18360 
tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 18420 

18449 

ggccagtgaa ttcgagctcg gtacccggg 
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<220> 

<221> misc_feature 

<222> (3471) . . (3471) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3679) . . (3679) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3770) . . (3770) 

<223> n is a, c, g, or t 



<400> 41 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 
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tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 
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tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 
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aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 
gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 
gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 
tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 
tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 
tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 
atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 
cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 
gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 
tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 
atatttgtct ctaattgtac tttgacatgc t.cctcttctt tactctgata gcttgactat 3660 
gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 
ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 
gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 
gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 
cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 
ctccacatct ccactcgacc tgcaggcatg caaagcttga gattaaaata gataaggaaa 4020 
agaaagtgaa aagaaattcg gaagcatggc acattcttct ttttataaat acatgcctga 4080 
ctttcttttt ccatcgatat gatatatgca tatgatagat atacaagcaa tcttcttcaa 4140 
ggagtttgaa attttgtcct ccaggagcaa aaaaaagttt ttttttatac atgtttgtac 4200 
acaagaatag ttaccaattt gctttggtct tacgtgctgc aagtttatat cgttttcaat 4260 
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ttctttgtct ttacattttc tttgtccttt atctttcctc atttagtctt tgggagaatt 4320 

aggaaaaggg agcggaaagg taagaaatgc ttgcgtattt tactaattcg gcaaacatcc 4380 

aatttggcaa acagcagcct gtgcaacgct ctcgagatga cagtatcttt gattacactc 4440 

taaatctcga tgacccgacc aaaaagagcg aacaaagaaa taatcttgtg cattcgaata 4500 

tgatggaaga ttttttcccc cttattctaa atgttgacat agcgtgtatg ttatataaac 4560 

aaaaagaaat tgtacaaact ttcttttctt ctctttttat tttatctcta tgctgtcgaa 4620 

gctgcagtca atcagcgtca aggcccgccg cgttgaacta gcccgcgaca tcacgcggcc 4680 

caaagtctgc ctgcatgctc agcggtgctc gttagttcgg ctgcgagtgg cagcaccaca 4740 

gacagaggag gcgctgggaa ccgtgcaggc tgccggcgcg ggcgatgagc acagcgccga 4800 

tgtagcactc cagcagcttg accgggctat cgcagagcgt cgtgcccggc gcaaacggga 4860 

gcagctgtca taccaggctg ccgccattgc agcatcaatt ggcgtgtcag gcattgccat 4920 

cttcgccacc tacctgagat ttgccatgca catgaccgtg ggcggcgcag tgccatgggg 4980 

tgaagtggct ggcactctcc tcttggtggt tggtggcgcg ctcggcatgg agatgtatgc 5040 

ccgctatgca cacaaagcca tctggcatga gtcgcctctg ggctggctgc tgcacaagag 5100 

ccaccacaca cctcgcactg gaccctttga agccaacgac ttgtttgcaa tcatcaatgg 5160 

actgcccgcc atgctcctgt gtacctttgg cttctggctg cccaacgtcc tgggggcggc 5220 

ctgctttgga gcggggctgg gcatcacgct atacggcatg gcatatatgt ttgtacacga 5280 

tggcctggtg cacaggcgct ttcccaccgg gcccatcgct ggcctgccct acatgaagcg 5340 

cctgacagtg gcccaccagc tacaccacag cggcaagtac ggtggcgcgc cctggggtat 5400 

gttcttgggt ccacaggagc tgcagcacat tccaggtgcg gcggaggagg tggagcgact 5460 

ggtcctggaa ctggactggt ccaagcgggc gattgtgact gatagcgaga ctctgggtcg 5520 
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atgttatctg cctcaacaat ggcttagaaa agaagaaaca gaacaaatac agcaaggcaa 5580 

cgcccgtagc ctaggtgatc aaagactgtt gggcttgtct ctgaagcttg taggaaaggc 5640 

agacgctatc atggtgagag ctaagaaggg cattgacaag ttgccggcaa actgtcaagg 5700 

cggtgtacga gctgcttgcc aagtatatgc tgcaattgga tctgtactca agcagcagaa 5760 

gacaacatat cctacaagag ctcatctaaa aggaagcgaa cgtgccaaga ttgctctgtt 5820 

gagtgtatac aacctctatc aatctgaaga caagcctgtg gctctccgtc aagctagaaa 5880 

gattaagagt ttttttgttg attagtgaat ttttgtttta tttatgtctg atagttcaat 5940 

aaagagacaa cacatacaat ataaaatcat tgtctttaaa tgttaattta gtagagtgta 6000 

aagcctgcat tttttttgta cgcataaaca atgaattcac cccgcttctg gtttttaaat 6060 

aattatgtca aactagggaa aattcttttt tttctcttcg ttcttttttt ggcttgttgt 6120 

ggagtcacag gcttgtcttc agattgatag aggttgtata cactcaacag agcaatcttg 6180 

gcacgttcgc ttccttttag atgagctctt gtaggatatg ttgtcttctg ctgcttgagt 6240 

acagatccaa ttgcagcata tacttggcaa gcagctcgta caccgccttg acagtttgcc 6300 

ggcaacttgt caatgccctt cttagctctc accatgatag cgtctgcctt tcctacaagc 6360 
ttcagagaca agcccaacag tctttgatca cctaggctac gggcgttgcc ttgctgtatt 6420 
tgttctgttt cttcttttct aagccattgt tgaggcagat aacatcgacc caacatcctc 6480 
gagccatact acagcataaa aggatacgtt ttctttaaca gaaatttacc cttttgttat 6540 
cagcacatac aaaaaaaaag aaatttaaga tgagtaggac ttccattctc tcaaaaattt 6600 
tattcaatcc ataaatgaat tatttttgga caaaaaagaa agattatgcc tgattttctc 6660 
tatttttttt ttttttacaa ctccaccaat actttctagc ccagcttggc gtaatcatgg 6720 
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 6780 
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ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 6840 

ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6900 

ggccaacgcg cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca 6960 

accgattgag ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca 7020 

ccgtcaccga cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta 7080 

ccattagcaa ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta 7140 

gcgacagaat caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg 7200 

gtcatagccc ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag 7260 

ccaccaccgg aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca 7320 

ccaccctcag agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc 7380 

ccgatctagt aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat 7440 

tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct 7500 

cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa 7560 
ttatatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca 7620 
aatgtttgaa cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga 7680 
acgcagcaag atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt 7740 
gatgtggacg ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc 7800 
cgttgctgtc gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc 7860 
gaagaactcc agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac 7920 
gattccgaag cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag 7980 
gttgggcgtc gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca 8040 
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agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 8100 

aagcggtcag cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg 8160 

tcctgatagc ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca 8220 

ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg 8280 

tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct 8340 

tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg 8400 

cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 8460 

attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc 8520 

tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc 8580 

acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc 8640 
agttcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct 8700 
gacagccgga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg 8760 
aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 8820 
cgaaacgatc cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt 8880 
ggataccgag gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta 8940 
gctgatagtg accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt 9000 
age teat taa actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca 9060 
gttccaaacg taaaaegget tgtcccgcgt categgeggg ggtcataacg tgactccctt 9120 
aattctccgc tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 9180 
acaggatata ttggcgggta aacctaagag aaaagagcgt ttattagaat aateggatat 9240 
ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 9300 
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gttccccaga tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat 9360 

ccgacagcgc gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca 9420 

gaatgccata gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca 9480 

gcaccggcat aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga 9540 

tcaggggtat gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa 9600 

cgcgcggatt ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt 9660 

gtcaagcatg acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa 9720 

cgaggtcggc gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca 9780 

gccggcgctt tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc 9840 

catgctggcg gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt 9900 

tctgatcggg aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg 9960 

catccatgcc ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg 10020 

cttcctctgc gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag 10080 . 

ctacttcact gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg 10140 

cggcggcacc gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt 10200 

cgacgaagcc ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt 10260 

ggcgaaaagg aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc 10320 

aggaccgctg ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct 10380 

ccccctttcc accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc 10440 

cctagcgtcc aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc 10500 

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 10560 
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cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 10620 
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 10680 
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 10740 
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 10800 
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 10860 
gcgcttttcc gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc 10920 
atcctttttc gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg 10980 
tatccaacgg cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc 11040 
cttcttcact gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg 11100 
ctggccggct accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc 11160 
aaccaggaag ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat 11220 
tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca 11280 
gggctacaaa atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa 11340 
tggcgacctg ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac 11400 
ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga 11460 
cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta 11520 
gccgctaaaa cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca 11580 
agaagagcga cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc 11640 
gcctttgcga cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc 11700 
cctgcaaacg cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt 11760 
tgtggatacc tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact 11820 
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tgaggggccg actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg 11880 
gcgacgtgga gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc 11940 
ccacagatga tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc 12000 
gcgactactg acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga 12060 
tgaggggcgc acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc 12120 
aagggtttcc gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca 12180 
atatttataa accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg 12240 
aaggggggtg cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc 12300 
ccaggggctg cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt 12360 
ccttgccatt gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc 12420 
cggaagcatt gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag 12480 
tgagggcggc ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga 12540 
cttcatggcg gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc 12600 
cgtgctcgtg ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt 12660 
ataccgaggt atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat 12720 
ttaaaaagct accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat 12780 
attgacaata ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga 12840 
tttcaggggg caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca 12900 
taaaaacttg catggactaa tgcttgaaac ocaggacaat aaccttatag cttgtaaatt 12960 
ctatcataat tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc 13020 
gatgactttg tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg 13080 
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tgccaggtgc tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct 13140 
gattacgtgc agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca 13200 
tatcaccacg tcaaagggtg acagcaggct cataagacgc cccagcgfccg ccatagtgcg 13260 
ttcaccgaat acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca 13320 
gcgctggcgc gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat 13380 
gacgtcactg cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga 13440 
cgtaaaatcg tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca 13500 
ttcatggcca tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac 13560 
tgcagttgcc atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt 13620 
ttgccgttac gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa 13680 
gccactggag cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc 13740 
cataattgtg gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac 13800 
aactttgaaa aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg 13860 
gagttcgtct tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa 13920 
ggaaataata aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat 13980 
accgctgcgt aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag 14040 
aaaatgaaaa cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg 14100 
tggaacggga aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc 14160 
tgcactttga acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc 14220 
tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg 14280 
agtgcatcag gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag 14340 
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acagccgctt agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg 14400 
aaaactggga agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga 14460 
cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct 14520 
ttgtgaaaga tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca 14580 
agtggtatga cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt 14640 
atgtcgagct attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt 14700 
atattttact ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag 14760 
caggagcgca ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc 14820 
aagtatttgg gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac 14880 
gagaaggacg gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg 14940 
gacaccaagg caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc 15000 
ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa 15060 
gaactgatcg acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc 15120 
atgcgtgcgc cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc 15180 
aagatcgagc gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc 15240 
gtggagcgtt cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc 15300 
gacacgcgag gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa 15360 
caggtcagcg aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa 15420 
atgcagcttt ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac 15480 
gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg 15540 
caaaacaagg tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag 15600 
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ctgcgggccg acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc 15660 
cctatcggcg agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg 15720 
atcaatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg 15780 
atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc 15840 
cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 15900 
gtcgtgctgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg 15960 
tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc 16020 
aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 16080 
gagcaggtcg gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg 16140 
gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg 16200 
ggttcagcag ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact 16260 
tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag 16320 
gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc 16380 
aggatttccg cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg 16440 
tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg 16500 
tggcattcgg cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg 16560 
acggccccaa ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc 16620 
gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga 16680 
tgatcgtccg acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac 16740 
ttaatatttc gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg 16800 
tcgcggcgac ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc 16860 
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taggtagccc gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg 16920 
cgctgttggt gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg 16980 
cgggggcggt ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc 17040 
ctctgctcac ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag 17100 
ctttagtgtt tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt 17160 
ggctcggcct gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac 17220 
tcgaacctac agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc 17280 
cggggatgca tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag 17340 
caatggatag gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc 17400 
ttcctcagcg gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca 17460 
gcctgtcacg gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg 17520 
agatgatatt tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 17580 
ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc 17640 
ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact 17700 
gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 17760 
ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac 17820 
acattgcgga cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa 17880 
cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 17940 
ttgccccagc aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat 18000 
aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 18060 
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 18120 
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ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 18180 
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 18240 
gcgagaaagg aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg 18300 
ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 18360 
tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 18420 

18449 

ggccagtgaa ttcgagctcg gtacccggg 
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ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 



60 



aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 
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aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 
atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 
ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 
ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 
gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 
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agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 
taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 
tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 
tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 
catgatgcta tggctggaag gaaagotgcc tgttccaaag gtcctgcact ttgaacggca 2520 
tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 
tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 
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tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 
attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 
cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 
ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 
agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 
cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 
tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 
attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 
tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 
ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 
cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 
gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 
gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 
ggttttccgc cgaggatgcc gaaacoatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 
aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 
gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 
tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 
agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 
tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 
ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 
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tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 
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cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 
attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 
accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 
ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 
cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 
gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 
agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 
ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 
cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 
tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 
cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 
caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 
gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 
taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 
aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 
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actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gtfcgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 
aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 
cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 
tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 
tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 
tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 
tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 
gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 
tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 
tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 
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gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 
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ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 
aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 
cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 
ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 
gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 
tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 
ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 
accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 
ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 
tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 
ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 
gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 
gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 
aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 
cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 
gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 
tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
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cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

* 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt tccgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt ttttcgagtt 10800 
tttttttttt ttctttgtga aggatttatt gttattggta tccatttttt attggaagac 10860 
aagataagtt aatattgatt ttgcttaaag attaaaagga aatcagaaaa cgacaataaa 10920 
aaatgtaacg gacaaactat ggtgtcgatt ataagtctaa atccttaaaa aatgacaacg 10980 
agttgcttte ctctgaaaac aattcttttg tctttgcaag aaaggtttct tttttgtttg 11040 
cttgcattac ttaaacatca aatcaaatga aaggaataaa gcagatttga gggcgaataa 11100 
ggattttctg gtcaacaaga tgtgagtgac acctaaggaa ctaaatgcca ttcatttgtt 11160 
ttaaaacgac atcaaagatt gatgatcaac aggattgaga gagagaaaaa gaactcgtgt 11220 
catttatttc tgttgactga aattttatat ttagaaaaaa tgtcaaatct atagctttag 11280 
ctatattaca taacatttga aataataata ataaaaaaag acacattaga gacacttttc 11340 
aaactctaaa taactgtcta taaacacaaa gaaaacaaag acctctataa caacttatta 11400 
gatttttctc gtacttttgt ctaaagatga tgtattcttg ttatcccaca cttctttcat 11460 
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ttgttcttga tgctactaaa tatacaaaat ttcttttttg caagagatat tattccaaaa 11520 
attttcaaaa agaaattttt ttcacaatag cagttgatcg tgtaacccaa agaggttctt 11580 
tgttattttg cacttccgct ttgcggtgat gcatattcaa agtaatatat ggaataaaca 11640 
acgtgtttaa gcatgaaaga aaggaaacaa aggccgcttt gaacaaatgc ataatatttc 11700 
agacaaaaat gatctaaagc aagcagtaaa tcaaacaaga aacattgctg attcgcgtta 11760 
gaaaacgata aaagtctaat aagccactaa gtatacttca atgaactttt tgtatgctta 11820 
tggtccaatc agaccaataa tttgtgacca ttcctgaggt ggctttggtg atgcggaaac 11880 
agaaaaaaat tttctcacca atcgatttaa aaaacaattt ctgctttgaa ccaaaacttt 11940 
ttttttctct ttaatcatta actttatcaa gtatgtacct accctcaaag tcctcactca 12000 
agcacaatta tgctaacatt gttccacctt ctctttagaa atgttgtgga tttggaatgc 12060 
cctgatcgtt ttcgttaccg tgattggcat ggaagtgatt gctgcactgg cacacaaata 12120 
catcatgcac ggctggggtt ggggatggca tctttcacat catgaaccgc gtaaaggtgc 12180 
gtttgaagtt aacgatcttt atgccgtggt ttttgctgca ttatcgatcc tgctgattta 12240 
tctgggcagt acaggaatgt ggccgctcca gtggattggc gcaggtatga cggcgtatgg 12300 
attactctat tttatggtgc acgacgggct ggtgcatcaa cgttggccat tccgctatat 12360 
tccacgcaag ggctacctca aacggttgta tatggcgcac cgtatgcatc aogccgtcag 12420 
gggcaaagaa ggttgtgttt cttttggctt cctctatgcg ccgcccctgt caaaacttca 12480 
ggcgacgctc cgggaaagac atggcgctag agcgggcgct gccagagatg cgcagggcgg 12540 
ggaggatgag cccgcatccg ggaagtaagg gcctgaccag aggcggccag cagcagcgtt 12600 
aatttttcgg gcgtggtcgt tgactgccgc tgatcccaaa gcttggcgta atcatggtca 12660 
tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 12720 
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agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 12780 
cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 12840 
caacgcgcgg ggagaggcgg tttgcgtatt gggccaaaga caaaagggcg acattcaacc 12900 
gattgaggga gggaaggtaa atattgacgg aaattattca ttaaaggtga attatcaccg 12960 
tcaccgactt gagccatttg ggaattagag ccagcaaaat caccagtagc accattacca 13020 
ttagcaaggc cggaaacgtc accaatgaaa ccatcgatag cagcaccgta atcagtagcg 13080 
acagaatcaa gtttgccttt agcgtcagac tgtagcgcgt tttcatcggc attttcggtc 13140 
atagccccct tattagcgtt tgccatcttt tcataatcaa aatcaccgga accagagcca 13200 
ccaccggaac cgcctccctc agagccgcca ccctcagaac cgccaccctc agagccacca 13260 
ccctcagagc cgccaccaga accaccacca gagccgccgc cagcattgac aggaggcccg 13320 
atctagtaac atagatgaca ccgcgcgcga taatttatcc tagtttgcgc gctatatttt 13380 
gttttctatc gcgtattaaa tgtataattg cgggactcta atcataaaaa cccatctcat 13440 
aaataacgtc atgcattaca tgttaattat tacatgctta acgtaattca acagaaatta 13500 
tatgataatc atcgcaagac cggcaacagg attcaatctt aagaaacttt attgccaaat 13560 
gtttgaacga tcggggatca tccgggtctg tggcgggaac tccacgaaaa tatccgaacg 13620 
cagcaagata tcgcggtgca tctcggtctt gcctgggcag tcgccgccga cgccgttgat 13680 
gtggacgccg ggcccgatca tattgtcgct caggatcgtg gcgttgtgct tgtcggccgt 13740 
tgctgtcgta atgatatcgg caccttcgac cgcctgttcc gcagagatcc cgtgggcgaa 13800 
gaactccagc atgagatccc cgcgctggag gatcatccag ccggcgtccc ggaaaacgat 13860 
tccgaagccc aacctttcat agaaggcggc ggtggaatcg aaatctcgtg atggcaggtt 13920 
gggcgtcgct tggtcggtca tttcgaaccc cagagtcccg ctcagaagaa ctcgtcaaga 13980 
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aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga taccgtaaag cacgaggaag 14040 
cggtcagccc attcgccgcc aagctcttca gcaatatcac gggtagccaa cgctatgtcc 14100 
tgatagcggt ccgccacacc cagccggcca cagtcgatga atccagaaaa gcggccattt 14160 
tccaccatga tattcggcaa gcaggcatcg ccatgggtca cgacgagatc atcgccgtcg 14220 
ggcatgcgcg ccttgagcct ggcgaacagt tcggctggcg cgagcccctg atgctcttcg 14280 
tccagatcat cctgatcgac aagaccggct tccatccgag tacgtgctcg ctcgatgcga 14340 
tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa gcgtatgcag ccgccgcatt 14400 
gcatcagcca tgatggatac tttctcggca ggagcaaggt gagatgacag gagatcctgc 14460 
cccggcactt cgcccaatag cagccagtcc cttcccgctt cagtgacaac gtcgagcaca 14520 
gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc gcgctgcctc gtcctgcagt 14580 
tcattcaggg caccggacag gtcggtcttg acaaaaagaa ccgggcgccc ctgcgctgac 14640 
agccggaaca cggcggcatc agagcagccg attgtctgtt gtgcccagtc atagccgaat 14700 
agcctctcca cccaagcggc cggagaacct gcgtgcaatc catcttgttc aatcatgcga 14760 
aacgatccag atccggtgca gattatttgg attgagagtg aatatgagac tctaattgga 14820 
taccgagggg aatttatgga acgtcagtgg agcatttttg acaagaaata tttgctagct 14880 
gatagtgacc ttaggcgact tttgaacgcg caataatggt ttctgacgta tgtgcttagc 14940 
tcattaaact ccagaaaccc gcggctgagt ggctccttca acgttgcggt tctgtcagtt 15000 
ccaaacgtaa aacggcttgt cccgcgtcat cggcgggggt cataacgtga ctcccttaat 15060 
tctccgctca tgatcagatt gtcgtttccc gccttcagtt taaactatca gtgtttgaca 15120 
ggatatattg gcgggtaaac ctaagagaaa agagcgttta ttagaataat cggatattta 15180 
aaagggcgtg aaaaggttta tccgttcgtc catttgtatg tgcatgccaa ccacagggtt 15240 
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ccccagatct ggcgccggcc agcgagacga gcaagattgg ccgccgcccg aaacgatccg 15300 
acagcgcgcc cagcacaggt gcgcaggcaa attgcaccaa cgcatacagc gccagcagaa 15360 
tgccatagtg ggcggtgacg tcgttcgagt gaaccagatc gcgcaggagg cccggcagca 15420 
ccggcataat caggccgatg ccgacagcgt cgagcgcgac agtgctcaga attacgatca 15480 
ggggtatgtt gggtttcacg tctggcctcc ggaccagcct ccgctggtcc gattgaacgc 15540 
gcggattctt tatcactgat aagttggtgg acatattatg tttatcagtg ataaagtgtc 15600 
aagcatgaca aagttgcagc cgaatacagt gatccgtgcc gccctggacc tgttgaacga 15660 
ggtcggcgta gacggtctga cgacacgcaa actggcggaa cggttggggg ttcagcagcc 15720 
ggcgctttac tggcacttca ggaacaagcg ggcgctgctc gacgcactgg ccgaagccat 15780 
gctggcggag aatcatacgc attcggtgcc gagagccgac gacgactggc gctcatttct 15840 
gatcgggaat gcccgcagct tcaggcaggc gctgctcgcc taccgcgatg gcgcgcgcat 15900 
ccatgccggc acgcgaccgg gcgcaccgca gatggaaacg gccgacgcgc agcttcgctt 15960 
cctctgcgag gcgggttttt cggccgggga cgccgtcaat gcgctgatga caatcagcta 16020 
cttcactgtt ggggccgtgc ttgaggagca ggccggcgac agcgatgccg gcgagcgcgg 16080 
cggcaccgtt gaacaggctc cgctctcgcc gctgttgcgg gccgcgatag acgccttcga 16140 
cgaagccggt ccggacgcag cgttcgagca gggactcgcg gtgattgtcg atggattggc 16200 
gaaaaggagg ctcgttgtca ggaacgttga aggaccgaga aagggtgacg attgatcagg 16260 
accgctgccg gagcgcaacc cactcactac agcagagcca tgtagacaac atcccctccc 16320 
cctttccacc gcgtcagacg cccgtagcag cccgctacgg gctttttcat gccctgccct 16380 
agcgtccaag cctcacggcc gcgctcggcc tctctggcgg ccttctggcg ctcttccgct 16440 
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 16500 
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tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 16560 
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 16620 
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 16680 
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 16740 
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 16800 
cttttccgct gcataaccct gcttcggggt cattatagcg attttttcgg tatatccatc 16860 
ctttttcgca cgatatacag gattttgcca aagggttcgt gtagactttc cttggtgtat 16920 
ccaacggcgt cagccgggca ggataggtga agtaggccca cccgcgagcg ggtgttcctt 16980 
cttcactgtc ccttattcgc acctggcggt gctcaacggg aatcctgctc tgcgaggctg 17040 
gccggctacc gccggcgtaa cagatgaggg caagcggatg gctgatgaaa ccaagccaac 17100 
caggaagggc agcccaccta tcaaggtgta ctgccttcca gacgaacgaa gagcgattga 17160 
ggaaaaggcg gcggcggccg gcatgagcct gtcggcctac ctgctggccg tcggccaggg 17220 
ctacaaaatc acgggcgtcg tggactatga gcacgtccgc gagctggccc gcatcaatgg 17280 
cgacctgggc cgcctgggcg gcctgctgaa actctggctc accgacgacc cgcgcacggc 17340 
gcggttcggt gatgccacga tcctcgccct gctggcgaag atcgaagaga agcaggacga 17400 
gcttggcaag gtcatgatgg gcgtggtccg cccgagggca gagccatgac ttttttagcc 17460 
gctaaaacgg ccggggggtg cgcgtgattg ccaagcacgt ccccatgcgc tccatcaaga 17520 
agagcgactt cgcggagctg gtgaagtaca tcaccgacga gcaaggcaag accgagcgcc 17580 
tttgcgacgc tea 17593 
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<220> 

<221> misc_feature 
<222> (10563) . . (10563) 

<223> n is a, c, g, or t 

<400> 43 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 



60 



aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 
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cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 
gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 12 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 12 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 
agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 
agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 
cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 
ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 
gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 
gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 
tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 
ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 
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tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 
tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 
ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 
aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 
aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 
ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 
aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 
taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 
tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 
tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 
catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 
tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 
tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 
tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 
attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 
cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 
ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 
agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 
cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 
tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 
attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 
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tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 . 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 
ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 
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gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 
cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 
tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 
ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 
cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 
attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 
accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 
ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 
cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 
gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 
agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 
ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 
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cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 63 
aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 
ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 
cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 
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gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 
tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 
gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 
tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 
tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 
gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 
atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 
cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 
ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 
tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 
cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 
tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 
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acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 
aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 
cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 
ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 
gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 
tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 
ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 
accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 
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ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 
tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 
ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 
gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 
gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 
aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 
cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 
gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 
tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
fccttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
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atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccacteg acctgcaggc atgcaagctt gagattaaaa 10800 
tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 
atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 
aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 
acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 
atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 
tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 
cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 
ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 
tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 
tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt attttatctc 11400 
tatgttgtgg atttggaatg ccctgatcgt tttcgttacc gtgattggca tggaagtgat 11460 
tgctgcactg gcacacaaat acatcatgca cggctggggt tggggatggc atctttcaca 11520 
tcatgaaccg cgtaaaggtg cgtttgaagt taacgatctt tatgccgtgg tttttgctgc 11580 
attatcgatc ctgctgattt atctgggcag tacaggaatg tggccgctcc agtggattgg 11640 
cgcaggtatg acggcgtatg gattactcta ttttatggtg cacgacgggc tggtgcatca 11700 
acgttggcca ttccgctata ttccacgcaa gggctacctc aaacggttgt atatggcgca 11760 
ccgtatgcat cacgccgtca ggggcaaaga aggttgtgtt tcttttggct tcctctatgc 11820 
gccgcccctg tcaaaacttc aggcgacgct ccgggaaaga catggcgcta gagcgggcgc 11880 
tgccagagat gcgcagggcg gggaggatga gcccgcatcc gggaagtaag ggcctgacca 11940 
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gaggcggcca gcagcagcgt taatttttcg ggcgtggtcg ttgactgccg ctgatcccaa 12000 
agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 12060 
ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 12120 
taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 12180 
cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggccaaag 12240 
acaaaagggc gacattcaac cgattgaggg agggaaggta aatattgacg gaaattattc 12300 
attaaaggtg aattatcacc gtcaccgact tgagccattt gggaattaga gccagcaaaa 12360 
tcaccagtag caccattacc attagcaagg ccggaaacgt caccaatgaa accatcgata 12420 
gcagcaccgt aatcagtagc gacagaatca agtttgcctt tagcgtcaga ctgtagcgcg 12480 
ttttcatcgg cattttcggt catagccccc ttattagcgt ttgccatctt ttcataatca 12540 
aaatcaccgg aaccagagcc accaccggaa ccgcctccct cagagccgcc accctcagaa 12600 
ccgccaccct cagagccacc accctcagag ccgccaccag aaccaccacc agagccgccg 12660 
ccagcattga caggaggccc gatctagtaa catagatgac accgcgcgcg ataatttatc 12720 
ctagtttgcg cgctatattt tgttttctat cgcgtattaa atgtataatt gcgggactct 12780 
aatcataaaa acccatctca taaataacgt catgcattac atgttaatta ttacatgctt 12840 
aacgtaattc aacagaaatt atatgataat catcgcaaga ccggcaacag gattcaatct 12900 
taagaaactt tattgccaaa tgtttgaacg atcggggatc atccgggtct gtggcgggaa 12960 
ctccacgaaa atatccgaac gcagcaagat atcgcggtgc atctcggtct tgcctgggca 13020 
gtcgccgccg acgccgttga tgtggacgcc gggcccgatc atattgtcgc tcaggatcgt 13080 
ggcgttgtgc ttgtcggccg ttgctgtcgt aatgatatcg gcaccttcga ccgcctgttc 13140 
cgcagagatc ccgtgggcga agaactccag catgagatcc ccgcgctgga ggatcatcca 13200 
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gccggcgtcc cggaaaacga ttccgaagcc caacctttca tagaaggcgg cggtggaatc 13260 
gaaatctcgt gatggcaggt tgggcgtcgc ttggtcggtc atttcgaacc ccagagtccc 13320 
gctcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc gggagcggcg 13380 
ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc agcaatatca 13440 
cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc acagtcgatg 13500 
aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc gccatgggtc 13560 
acgacgagat catcgccgtc gggcatgcgc gccttgagcc tggcgaacag ttcggctggc 13620 
gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc ttccatccga 13680 
gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca 13740 
agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc aggagcaagg 13800 
tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc ccttcccgct 13860 
tcagtgacaa cgtcgagcac agctgcgcaa ggaacgcccg tcgtggccag ccacgatagc 13920 
cgcgctgcct cgtcctgcag ttcattcagg gcaccggaca ggtcggtctt gacaaaaaga 13980 
accgggcgcc cctgcgctga cagccggaac acggcggcat cagagcagcc gattgtctgt 14040 
tgtgcccagt catagccgaa tagcctctcc acccaagcgg ccggagaacc tgcgtgcaat 14100 
ccatcttgtt caatcatgcg aaacgatcca gatccggtgc agattatttg gattgagagt 14160 
gaatatgaga ctctaattgg ataccgaggg gaatttatgg aacgtcagtg gagcattttt 14220 
gacaagaaat atttgctagc tgatagtgac cttaggcgac ttttgaacgc gcaataatgg 14280 
tttctgacgt atgtgcttag ctcattaaac tccagaaacc cgcggctgag tggctccttc 14340 
aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg 14400 
tcataacgtg actcccttaa ttctccgctc atgatcagat tgtcgtttcc cgccttcagt 14460 
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ttaaactatc agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt 14520 
attagaataa tcggatattt aaaagggcgt gaaaaggttt atccgttcgt ccatttgtat 14580 
gtgcatgcca accacagggt tccccagatc tggcgccggc cagcgagacg agcaagattg 14640 
gccgccgccc gaaacgatcc gacagcgcgc ccagcacagg tgcgcaggca aattgcacca 14700 
acgcatacag cgccagcaga atgccatagt gggcggtgac gtcgttcgag tgaaccagat 14760 
cgcgcaggag gcccggcagc accggcataa tcaggccgat gccgacagcg tcgagcgcga 14820 
cagtgctcag aattacgatc aggggtatgt tgggtttcac gtctggcctc cggaccagcc 14880 
tccgctggtc cgattgaacg cgcggattct ttatcactga taagttggtg gacatattat 14940 
gtttatcagt gataaagtgt caagcatgac aaagttgcag ccgaatacag tgatccgtgc 15000 
cgccctggac ctgttgaacg aggtcggcgt agacggtctg acgacacgca aactggcgga 15060 
acggttgggg gttcagcagc cggcgcttta ctggcacttc aggaacaagc gggcgctgct 15120 
cgacgcactg gccgaagcca tgctggcgga gaatcatacg cattcggtgc cgagagccga 15180 
cgacgactgg cgctcatttc tgatcgggaa tgcccgcagc ttcaggcagg cgctgctcgc 15240 
ctaccgcgat ggcgcgcgca tccatgccgg cacgcgaccg ggcgcaccgc agatggaaac 15300 
ggccgacgcg cagcttcgct tcctctgcga ggcgggtttt tcggccgggg acgccgtcaa 15360 
tgcgctgatg acaatcagct acttcactgt tggggccgtg cttgaggagc aggccggcga 15420 
cagcgatgcc ggcgagcgcg gcggcaccgt tgaacaggct ccgctctcgc cgctgttgcg 15480 
ggccgcgata gacgccttcg acgaagccgg tccggacgca gcgttcgagc agggactcgc 15540 
ggtgattgtc gatggattgg cgaaaaggag gctcgttgtc aggaacgttg aaggaccgag 15600 
aaagggtgac gattgatcag gaccgctgcc ggagcgcaac ccactcacta cagcagagcc 15660 
atgtagacaa catcccctcc ccctttccac cgcgtcagac gcccgtagca gcccgctacg 15720 
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ggctttttca tgccctgccc tagcgtccaa gcctcacggc cgcgctcggc ctctctggcg 15780 
gccttctggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 15840 
cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 15900 
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 15960 
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 16020 
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 16080 
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 16140 
ctcccttcgg gaagcgtggc gcttttccgc tgcataaccc tgcttcgggg tcattatagc 16200 
gattttttcg gtatatccat cctttttcgc acgatataca ggattttgcc aaagggttcg 16260 
tgtagacttt ccttggtgta tccaacggcg tcagccgggc aggataggtg aagtaggccc 16320 
acccgcgagc gggtgttcct tcttcactgt cccttattcg cacctggcgg tgctcaacgg 16380 
gaatcctgct ctgcgaggct ggccggctac cgccggcgta acagatgagg gcaagcggat 16440 
ggctgatgaa accaagccaa ccaggaaggg cagcccacct atcaaggtgt actgccttcc 16500 
agacgaacga agagcgattg aggaaaaggc ggcggcggcc ggcatgagcc tgtcggccta 16560 
cctgctggcc gtcggccagg gctacaaaat cacgggcgtc gtggactatg agcacgtccg 16620 
cgagctggcc cgcatcaatg gcgacctggg ccgcctgggc ggcctgctga aactctggct 16680 
caccgacgac ccgcgcacgg cgcggttcgg tgatgccacg atcctcgccc tgctggcgaa 16740 
gatcgaagag aagcaggacg agcttggcaa ggtcatgatg ggcgtggtcc gcccgagggc 16800 
agagccatga cttttttagc cgctaaaacg gccggggggt gcgcgtgatt gccaagcacg 16860 
tccccatgcg ctccatcaag aagagcgact tcgcggagct ggtgaagtac atcaccgacg 16920 
agcaaggcaa gaccgagcgc ctttgcgacg ctca 16954 
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<210> 44 

<211> 16954 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 



<400> 44 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 



60 



aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 
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ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 
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tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 
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tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 
tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 
agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 
tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 
ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 
tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 
acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 
tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 
acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 
accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 
gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 



WO 2004/063359 PCT/EP2004/000099 

202/357 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 
ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 
gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 
cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 
tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 
ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 
gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 
tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 
ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 
gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 
catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 
tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 
cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 
tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 
ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 
cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 
attgatggcg gtcctggggg ctattfcgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 
accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 
ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 
cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 
gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 
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agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 
cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 
ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 
agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 
cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 
tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 
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ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 
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accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 
cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 
tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 
aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 
cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 
tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 
tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 
ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 
aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 
cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 
ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 
gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 
tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 
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ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960. 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
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canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt agagataaaa 10800 
taaaaagaga agaaaagaaa gtttgtacaa tttctttttg tttatataac atacacgcta 10860 
tgtcaacatt tagaataagg gggaaaaaat cttccatcat attcgaatgc acaagattat 10920 
ttctttgttc gctctttttg gtcgggtcat cgagatttag agtgtaatca aagatactgt 10980 
catctcgaga gcgttgcaca ggctgctgtt tgccaaattg gatgtttgcc gaattagtaa 11040 
aatacgcaag catttcttac ctttccgctc ccttttccta attctcccaa agactaaatg 11100 
aggaaagata aaggacaaag aaaatgtaaa gacaaagaaa ttgaaaacga tataaacttg 11160 
cagcacgtaa gaccaaagca aattggtaac tattcttgtg tacaaacatg tataaaaaaa 11220 
aacttttttt tgctcctgga ggacaaaatt tcaaactcct tgaagaagat tgcttgtata 11280 
tctatcatat gcatatatca tatcgatgga aaaagaaagt caggcatgta tttataaaaa 11340 
gaagaatgtg ccatgcttcc gaatttcttt tcactttctt ttccttatct attttaatct 11400 
catgttgtgg atttggaatg ccctgatcgt tttcgttacc gtgattggca tggaagtgat 11460 
tgctgcactg gcacacaaat acatcatgca cggctggggt tggggatggc atctttcaca 11520 
tcatgaaccg cgtaaaggtg cgtttgaagt taacgatctt tatgccgtgg tttttgctgc 11580 
attatcgatc ctgctgattt atctgggcag tacaggaatg tggccgctcc agtggattgg 11640 
cgcaggtatg acggcgtatg gattactcta ttttatggtg cacgacgggc tggtgcatca 11700 
acgttggcca ttccgctata ttccacgcaa gggctacctc aaacggttgt atatggcgca 11760 
ccgtatgcat cacgccgtca ggggcaaaga aggttgtgtt tcttttggct tcctctatgc 11820 
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gccgcccctg tcaaaacttc aggcgacgct ccgggaaaga catggcgcta gagcgggcgc 11880 
tgccagagat gcgcagggcg gggaggatga gcccgcatcc gggaagtaag ggcctgacca 11940 
gaggcggcca gcagcagcgt taatttttcg ggcgtggtcg ttgactgccg ctgatcccaa 12000 
agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 12060 
ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 12120 
taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 12180. 
cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggccaaag 12240 
acaaaagggc gacattcaac cgattgaggg agggaaggta aatattgacg gaaattattc 12300 
attaaaggtg aattatcacc gtcaccgact tgagccattt gggaattaga gccagcaaaa 12360 
tcaccagtag caccattacc attagcaagg ccggaaacgt caccaatgaa accatcgafca 12420 
gcagcaccgt aatcagtagc gacagaatca agtttgcctt tagcgtcaga ctgtagcgcg 12480 
ttttcatcgg cattttcggt catagccccc ttattagcgt ttgccatctt ttcataatca 12540 
aaatcaccgg aaccagagcc accacoggaa ccgcctccct cagagccgcc accctcagaa 12600 
ccgccaccct cagagccacc accctcagag ccgccaccag aaccaccacc agagccgccg 12660 
ccagcattga caggaggccc gatctagtaa catagatgac accgcgcgcg ataatttatc 12720 
ctagtttgcg cgctatattt tgttttctat cgcgtattaa atgtataatt gcgggactct 12780 
aatcataaaa acccatctca taaataacgt catgcattac atgttaatta ttacatgctt 12840 
aacgtaattc aacagaaatt atatgataat catcgcaaga ccggcaacag gattcaatct 12900 
taagaaactt tattgccaaa tgtttgaacg atcggggatc atccgggtct gtggcgggaa 12960 
ctccacgaaa atatccgaac gcagcaagat atcgcggtgc atctcggtct tgcctgggca 13020 
gtcgccgccg acgccgttga tgtggacgcc gggcccgatc atattgtcgc tcaggatcgt 13080 
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ggcgttgtgc ttgtcggccg ttgctgtcgt aatgatatcg gcaccttcga ccgcctgttc 13140 
cgcagagatc ccgtgggcga agaactccag catgagatcc ccgcgctgga ggatcatcca 13200 
gccggcgtcc cggaaaacga ttccgaagcc caacctttca tagaaggcgg cggtggaatc 13260 
gaaatctcgt gatggcaggt tgggcgtcgc ttggtcggtc atttcgaacc ccagagtccc 13320 
gctcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc gggagcggcg 13380 
ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc agcaatatca 13440 
cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc acagtcgatg 13500 
aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc gccatgggtc 13560 
acgacgagat catcgccgtc gggcatgcgc gccttgagcc tggcgaacag ttcggctggc 13620 
gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc ttccatccga 13680 
gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca 13740 
agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc aggagcaagg 13800 
tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc ccttcccgct 13860 
tcagtgacaa cgtcgagcac agctgcgcaa ggaacgcccg tcgtggcoag ccacgatagc 13920 
cgcgctgcct cgtcctgcag ttcattcagg gcaccggaca ggtcggtctt gacaaaaaga 13980 
accgggcgcc cctgcgctga cagccggaac acggcggcat cagagcagcc gattgtctgt 14040 
tgtgcccagt catagccgaa tagcctctcc acccaagcgg ccggagaacc tgcgtgcaat 14100 
ccatcttgtt caatcatgcg aaacgatcca gatccggtgc agattatttg gattgagagt 14160 
gaatatgaga ctctaattgg ataccgaggg gaatttatgg aacgtcagtg gagcattttt 14220 
gacaagaaat atttgctagc tgatagtgac cttaggcgac ttttgaacgc gcaataatgg 14280 
tttctgacgt atgtgcttag ctcattaaac tccagaaacc cgcggctgag tggctccttc 14340 
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aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg 14400 
tcataacgtg actcccttaa ttctccgctc atgatcagat tgtcgtttcc cgccttcagt 14460 
ttaaactatc agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt 14520 
attagaataa tcggatattt aaaagggcgt gaaaaggttt atccgttcgt ccatttgtat 14580 
gtgcatgcca accacagggt tccccagatc tggcgccggc cagcgagacg agcaagattg 14640 
gccgccgccc gaaacgatcc gacagcgcgc ccagcacagg tgcgcaggca aattgcacca 14700 
acgcatacag cgccagcaga atgccatagt gggcggtgac gtcgttcgag tgaaccagat 14760 
cgcgcaggag gcccggcagc accggcataa tcaggccgat gccgacagcg tcgagcgcga 14820 
cagtgctcag aattacgatc aggggtatgt tgggtttcac gtctggcctc cggaccagcc 14880 
tccgctggtc cgattgaacg cgcggattct ttatcactga taagttggtg gacatattat 14940 
gtttatcagt gataaagtgt caagcatgac aaagttgcag ccgaatacag tgatccgtgc 15000 
cgccctggac ctgttgaacg aggtcggcgt agacggtctg acgacacgca aactggcgga 15060 
acggttgggg gttcagcagc cggcgcttta ctggcacttc aggaacaagc gggcgctgct 15120 
cgacgcactg gccgaagcca tgctggcgga gaatcatacg cattcggtgc cgagagccga 15180 
cgacgactgg cgctcatttc tgatcgggaa tgcccgcagc ttcaggcagg cgctgctcgc 15240 
ctaccgcgat ggcgcgcgca tccatgccgg cacgcgaccg ggcgcaccgc agatggaaac 
ggccgacgcg cagcttcgct tcctctgcga ggcgggtttt tcggccgggg acgccgtcaa 153 
tgcgctgatg acaatcagct acttcactgt tggggccgtg cttgaggagc aggccggcga 
cagcgatgcc ggcgagcgcg gcggcaccgt tgaacaggct ccgctctcgc cgctgttgcg 15480 
ggccgcgata gacgccttcg acgaagccgg tccggacgca gcgttcgagc agggactcgc 15540 
ggtgattgtc gatggattgg cgaaaaggag gctcgttgtc aggaacgttg aaggaccgag 15600 
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aaagggtgac gattgatcag gaccgctgcc ggagcgcaac ccactcacta cagcagagcc 15660 
atgtagacaa catcccctcc ccctttccac cgcgtcagac gcccgtagca gcccgctacg 15720 
ggctttttca tgccctgccc tagcgtccaa gcctcacggc cgcgctcggc ctctctggcg 15780 
gccttctggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 15840 
cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 15900 
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 15960 
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 16020 
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 16080 
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 16140 
ctcccttcgg gaagcgtggc gcttttccgc tgcataaccc tgcttcgggg tcattatagc 16200 
gattttttcg gtatatccat cctttttcgc acgatataca ggattttgcc aaagggttcg 16260 
tgtagacttt ccttggtgta tccaacggcg tcagccgggc aggataggtg aagtaggccc 16320 
acccgcgagc gggtgttcct tcttcactgt cccttattcg cacctggcgg tgctcaacgg 16380 
gaatcctgct ctgcgaggct ggccggctac cgccggcgta acagatgagg gcaagcggat 16440 
ggctgatgaa accaagccaa ccaggaaggg cagcccacct atcaaggtgt actgccttcc 16500 
agacgaacga agagcgattg aggaaaaggc ggcggcggcc ggcatgagcc tgtcggccta 16560 
cctgctggcc gtcggccagg gctacaaaat cacgggcgtc gtggactatg agcacgtccg 16620 
cgagctggcc cgcatcaatg gcgacctggg ccgcctgggc ggcctgctga aactctggct 16680 
caccgacgac ccgcgcacgg cgcggttcgg tgatgccacg atcctcgccc tgctggcgaa 16740 
gatcgaagag aagcaggacg agcttggcaa ggtcatgatg ggcgtggtcc gcccgagggc 16800 
agagccatga cttttttagc cgctaaaacg gccggggggt gcgcgtgatt gccaagcacg 16860 
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tccccatgcg ctccatcaag aagagcgact tcgcggagct ggtgaagtac atcaccgacg 16920 
agcaaggcaa gaccgagcgc ctttgcgacg ctca 16954 
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<400> 45 

agcttggtac cgagctcgga tccactagta acggccgcca gtgtgctgga attcgccctt 
gacggccagt gaattcgagc tcggtacccg gggatctttc gacactgaaa tacgtcgagc 
ctgctccgct tggaagcggc gaggagcctc gtcctgtcac aactaccaac atggagtacg 
ataagggcca gttccgccag ctcattaaga gccagttcat gggcgttggc atgatggccg 
tcatgcatct gtacttcaag tacaccaacg ctcttctgat ccagtcgatc atccgctgaa 
ggcgctttcg aatctggtta agatccacgt cttcgggaag ccagcgactg gtgacctcca 
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gcgtcccttt aaggctgcca acagctttct cagccagggc cagcccaaga ccgacaaggc 420 

ctccctccag aacgccgaga agaactggag gggtggtgtc aaggaggagt aagctcctta 480 

ttgaagtcgg aggacggagc ggtgtcaaga ggatattctt cgactctgta ttatagataa 540 

gatgatgagg aattggaggt agcatagctt catttggatt tgctttccag gctgagactc 600 

tagcttggag catagagggt cctttggctt tcaatattct caagtatctc gagtttgaac 660 

ttattccctg tgaacctttt attcaccaat gagcattgga atgaacatga atctgaggac 720 

tgcaatcgcc atgaggtttt cgaaatacat ccggatgtcg aaggcttggg gcacctgcgt 780 

tggttgaatt tagaacgtgg cactattgat catccgatag ctctgcaaag ggcgttgcac 840 

aatgcaagtc aaacgttgct agcagttcca ggtggaatgt tatgatgagc attgtattaa 900 

atcaggagat atagcatgat ctctagttag ctcaccacaa aagtcagacg gcgtaaccaa 960 

aagtcacaca acacaagctg taaggatttc ggcacggcta cggaagacgg agaagccacc 1020 

ttcagtggac tcgagtacca tttaattcta tttgtgtttg atcgagacct aatacagccc 1080 

ctacaacgac catcaaagtc gtatagctac cagtgaggaa gtggactcaa atcgacttca 1140 

gcaacatctc ctggataaac tttaagccta aactatacag aataagatag gtggagagct 1200 

tataccgagc tcccaaatct gtccagatca tggttgaccg gtgcctggat cttcctatag 1260 

aatcatcctt attcgttgac ctagctgatt ctggagtgac ccagagggtc atgacttgag 1320 

cctaaaatcc gccgcctcca ccatttgtag aaaaatgtga cgaactcgtg agctctgtac 1380 

agtgaccggt gactctttct ggcatgcgga gagacggacg gacgcagaga gaagggctga 1440 

gtaataagcc actggccaga cagctctggc ggctctgagg tgcagtggat gattattaat 1500 

ccgggaccgg ccgcccctcc gccccgaagt ggaaaggctg gtgtgcccct cgttgaccaa 1560 

gaatctattg catcatcgga gaatatggag cttcatcgaa tcaccggcag taagcgaagg 1620 
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agaatgtgaa gccaggggtg tatagccgtc ggcgaaatag catgccatta acctaggtac 1680 

agaagtccaa ttgcttccga tctggtaaaa gattcacgag atagtacctt ctccgaagta 1740 

ggtagagcga gtacccggcg cgtaagctcc ctaattggcc catccggcat ctgtagggcg 1800 

tccaaatatc gtgcctctcc tgctttgccc ggtgtatgaa accggaaagg ccgctcagga 1860 

gctggccagc ggcgcagacc gggaacacaa gctggcagtc gacccatccg gtgctctgca 1920 

ctcgacctgc tgaggtccct cagtccctgg taggcagctt tgccccgtct gtccgcccgg 1980 

tgtgtcggcg gggttgacaa ggtcgttgcg tcagtccaac atttgttgcc atattttcct 2040 

gctctcccca ccagctgctc ttttcttttc tctttctttt cccatcttca gtatattcat 2100 

cttcccatcc aagaaccttt atttccccta agtaagtact ttgctacatc catactccat 2160 

ccttcccatc ccttattcct ttgaaccttt cagttcgagc tttcccactt catcgcagct 2220 

tgactaacag ctaccccgct tgagcagaca tcaccatgct gtcgaagctg cagtcaatca 2280 

gcgtcaaggc ccgccgcgtt gaactagccc gcgacatcac gcggcccaaa gtctgcctgc 2340 

atgctcagcg gtgctcgtta gttcggctgc gagtggcagc accacagaca gaggaggcgc 2400 

tgggaaccgt gcaggctgcc ggcgcgggcg atgagcacag cgccgatgta gcactccagc 2460 

agcttgaccg ggctatcgca gagcgtcgtg cccggcgcaa acgggagcag ctgtcatacc 2520 

aggctgccgc cattgcagca tcaattggcg tgtcaggcat tgccatcttc gccacctacc 2580 

tgagatttgc catgcacatg accgtgggcg gcgcagtgcc atggggtgaa gtggctggca 2640 

ctctcctctt ggtggttggt ggcgcgctcg gcatggagat gtatgcccgc tatgcacaca 2700 

aagccatctg gcatgagtcg cctctgggct ggctgctgca caagagccac cacacacctc 2760 

gcactggacc ctttgaagcc aacgacttgt ttgcaatcat caatggactg cccgccatgc 2820 

tcctgtgtac ctttggcttc tggctgccca acgtcctggg ggcggcctgc tttggagcgg 2880 
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ggc tgggcat cacgctatac ggcatggcat atatgtttgt acacgatggc ctggtgcaca 2940 

ggcgctttcc caccgggccc atcgctggcc tgccctacat gaagcgcctg acagtggccc 3000 

accagctaca ccacagcggc aagtacggtg gcgcgccctg gggtatgttc ttgggtccac 3060 

aggagctgca gcacattcca ggtgcggcgg aggaggtgga gcgactggtc ctggaactgg 3120 

actggtccaa gcggtagggt gcggaaccag gcacgctggt ttcacacctc atgcctgtga 3180 

taaggtgtgg ctagagcgat gcgtgtgaga cgggtatgtc acggtcgact ggtctgatgg 3240 

ccaatggcat cggccatgtc tggtcatcac gggctggttg cctgggtgaa. ggtgatgcac 3300 

atcatcatgt gcggttggag gggctggcac agtgtgggct gaactggagc agttgtccag 3360 

gctggcgttg aatcagtgag ggtttgtgat tggcggttgt gaagcaatga ctccgcccat 3420 

attctatttg tgggagctga gatgatggca tgcttgggat gtgcatggat catggtagtg 3480 

cagcaaacta tattcaccta gggctgttgg taggatcagg tgaggccttg cacattgcat 3540 

gatgtactcg tcatggtgtg ttggtgagag gatggatgtg gatggatgtg tattctcaga 3600 

cgtagacctt gactggaggc ttgatcgaga gagtgggccg tattctttga gaggggaggc 3660 

tcgtgccaga aatggtgagt ggatgactgt gacgctgtac attgcaggca ggtgagatgc 3720 

actgtctcga ttgtaaaata cattcagatg caagcttggc gtaatcatgg tcatagctgt 3780 

ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 3840 

agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 3900 

tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 3960 

cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca accgattgag 4020 

ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca ccgtcaccga 4080 

cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta ccattagcaa 4140 
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ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta gcgacagaat 4200 

caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc 4260 

ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg 4320 

aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca ccaccctcag 4380 

agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgatctagt 4440 

aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttttct 4500 

atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct cataaataac 4560 

gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa ttatatgata 4620 

atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca aatgtttgaa 4680 

cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga acgcagcaag 4740 

atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt gatgtggacg 4800 

ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc cgttgctgtc 4860 

gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc gaagaactcc 4920 

agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac gattccgaag 4980 

cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag gttgggcgtc 5040 

gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat 5100 

agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag 5160 

cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc 5220 

ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca 5280 

tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg tcgggcatgc 5340 

gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat 5400 
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catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg 5460 
cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag 5520 
ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca 5580 
cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc 5640 
aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agttcattca 5700 
gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga 5760 
acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagcctct 5820 
ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc 5880 
cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt ggataccgag 5940 
gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagtg 6000 
accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa 6060 
actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca gttccaaacg 6120 
taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt aattctccgc 6180 
tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg acaggatata 6240 
ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat ttaaaagggc 6300 
gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttccccaga 6360 
tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat ccgacagcgc 6420 
gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca gaatgccata 6480 
gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca gcaccggcat 6540 
aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga tcaggggtat 6600 
gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa cgcgcggatt 6660 
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ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt gtcaagcatg 6720 

acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa cgaggtcggc 6780 

gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca gccggcgctt 6840 

tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc catgctggcg 6900 

gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg 6960 

aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg catccatgcc 7020 

ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg cttcctctgc 7080 

gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag ctacttcact 7140 

gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc 7200 

gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt cgacgaagcc 7260 
ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt ggcgaaaagg 7320 
aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc aggaccgctg 7380 
ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct ccccctttcc 7440 
accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc cctagcgtcc 7500 
aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc 7560 
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7620 
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7680 
gccagcaaaa ggccaggaac cgtaaaaagg ccgogttgct ggcgtttttc cataggctcc 7740 
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 7800 
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 7860 
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgcttttcc 7920 
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gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc atcctttttc 7980 

gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg tatccaacgg 8040 

cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc cttcttcact 8100 

gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg ctggccggct 8160 

accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag 8220 

ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat tgaggaaaag 8280 

gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca gggctacaaa 8340 

atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg 8400 

ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac ggcgcggttc 8460 

ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga cgagcttggc 8520 

aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta gccgctaaaa 8580 

cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga 8640 

cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc gcctttgcga 8700 

cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc cctgcaaacg 8760 

cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt tgtggatacc 8820 

tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact tgaggggccg 8880 

actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg gcgacgtgga 8940 

gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc ccacagatga 9000 

tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc gcgactactg 9060 

acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga tgaggggcgc 9120 

acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc aagggtttcc 9180 
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gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca atatttataa 9240 

accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg aaggggggtg 9300 

cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc ccaggggctg 9360 

cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt ccttgccatt 9420 

gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc cggaagcatt 9480 

gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag tgagggcggc 9540 

ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga cttcatggcg 9600 

gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc cgtgctcgtg 9660 

ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt ataccgaggt 9720 

atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat ttaaaaagct 9780 

accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat attgacaata 9840 
ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga tttcaggggg 9900 
caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca taaaaacttg 9960 

catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt ctatcataat 10020 

tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc gatgactttg 10080 

tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg tgccaggtgc 10140 

tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct gattacgtgc 10200 

agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca tatcaccacg 10260 

tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg ttcaccgaat 10320 
acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca gcgctggcgc 10380 
gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat gacgtcactg 10440 
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cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga cgtaaaatcg 10500 
tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca ttcatggcca 10560 
tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac tgcagttgcc 10620 
atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt ttgccgttac 10680 
gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa gccactggag 10740 
cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc cataattgtg 10800 
gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac aactttgaaa 10860 
aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg gagttcgtct 10920 
tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa ggaaataata 10980 
aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat accgctgcgt 11040 
aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa 11100 
cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg tggaacggga 11160 
aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga 11220 
acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc tttgctcgga 11280 
agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg agtgcatcag 11340 
gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag acagccgctt 11400 
agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg aaaactggga 11460 
agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga cggaaaagcc 11520 
cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct ttgtgaaaga 11580 
tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca agtggtatga 11640 
cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt atgtcgagct 11700 
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attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt atattttact 11760 
ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag caggagcgca 11820 
ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc aagtatttgg 11880 
gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac gagaaggacg 11940 
gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg gacaccaagg 12000 
caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc ggggcaatcc 12060 
cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa gaactgatcg 12120 
acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc atgcgtgcgc 
cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc aagatcgagc 
gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc gtggagcgtt 
cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc gacacgcgag 
gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa caggtcagcg 
aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa atgcagcttt 12480 
ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac gacacggccc 12540 
gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg caaaacaagg 12600 
tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag ctgcgggccg 12660 
acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc cctatcggcg 12720 
agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg atcaatggcc 12780 
ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg atgggcttca 12840 
cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc cgcgtcctgg 12900 
accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc gtcgtgctgt 12960 
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ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg tcgccgacgg 13020 
cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc aagctggaaa 13080 
ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc gagcaggtcg 13140 
gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg gtcaatgatg 13200 
acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg ggttcagcag 13260 
ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact tgcttcgctc 13320 
agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag gattaaaatt 13380 
gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc aggatttccg 13440 
cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg tttacgagca 13500 
cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg tggcattcgg 13560 
cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg . acggccccaa 13620 
ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc gaggccgagg 13680 
ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga tgatcgtccg 13740 
acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac ttaatatttc 13 800 
gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg tcgcggcgac 13860 
ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc taggtagccc 13920 
gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg cgctgttggt 13980 
gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg cgggggcggt 14040 
ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc ctctgctcac 14100 
ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag ctttagtgtt 14160 
tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt ggctcggcct 14220 
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gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac tcgaacctac 14280 
agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc cggggatgca 14340 
tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag caatggatag 14400 
gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc ttcctcagcg 14460 
gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca gcctgtcacg 14520 
gttaagcgag aaatgaataa gaaggctgat aattcggatc iictgcgaggg agatgatatt 14580 
tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct ccgcgagatc 14640 
atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc ggtaacatga 14700 
gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact gatgggctgc 14760 
ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg ctggctggtg 14820 
gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac acattgcgga 14880 
cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa cagctgattg 14940 
cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt ttgccccagc 15000 
aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat aaatcaaaag 15060 
aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 15120 
acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 15180 
aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 15240 
ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 15300 
aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg ggaagggcga 15360 
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 15420 
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa 15480 
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ttcgagctcg gtacccgggg atctttcgac actgaaatac gtcgagcctg ctccgcttgg 15540 
aagcggcgag gagcctcgtc ctgtcacaac taccaacatg gagtacgata agggccagtt 15600 
ccgccagctc attaagagcc agttcatggg cgttggcatg atggccgtca tgcatctgta 15660 
cttcaagtac accaacgctc ttctgatcca gtcgatcatc cgctgaaggc gctttcgaat 15720 
ctggttaaga tccacgtctt cgggaagcca gcgactggtg acctccagcg tccctttaag 157 
gctgccaaca gctttctcag ccagggccag cccaagaccg acaaggcctc cctccagaac 15 
gccgagaaga actggagggg tggtgtcaag gaggagtaag ctccttattg aagtcggagg 15900 
acggagcggt gtcaagagga tattcttcga ctctgtatta tagataagat gatgaggaat 15960 
tggaggtagc atagcttcat ttggatttgc tttccaggct gagactctag cttggagcat 16020 
agagggtcct ttggctttca atattctcaa gtatctcgag tttgaactta ttccctgtga 16080 
accttttatt caccaatgag cattggaatg aacatgaatc tgaggactgc aatcgccatg 16140 
aggttttcga aatacatccg gatgtcgaag gcttggggca cctgcgttgg ttgaatttag 16200 
aacgtggcac tattgatcat ccgatagctc tgcaaagggc gttgcacaat gcaagtcaaa 16260 
cgttgctagc agttccaggt ggaatgttat gatgagcatt gtattaaatc aggagatata 16320 
gcatgatctc tagttagctc accacaaaag tcagacggcg taaccaaaag tcacacaaca 16380 
caagctgtaa ggatttcggc acggctacgg aagacggaga agccaccttc agtggactcg 16440 
agtaccattt aattctattt gtgtttgatc gagacctaat acagccccta caacgaccat 16500 
caaagtcgta tagctaccag tgaggaagtg gactcaaatc gacttcagca acatctcctg 16560 
gataaacttt aagcctaaac tatacagaat aagataggtg gagagcttat accgagctcc 16620 
caaatctgtc cagatcatgg ttgaccggtg cctggatctt cctatagaat catccttatt 16680 
cgttgaccta gctgattctg gagtgaccca gagggtcatg acttgagcct aaaatccgcc 16740 
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gcctccacca tttgtagaaa aatgtgacga actcgtgagc tctgtacagt gaccggtgac 16800 
tctttctggc atgcggagag acggacggac gcagagagaa gggctgagta ataagccact 16860 
ggccagacag ctctggcggc tctgaggtgc agtggatgat tattaatccg ggaccggccg 16920 
cccctccgcc ccgaagtgga aaggctggtg tgcccctcgt tgaccaagaa tctattgoat 16980 
catcggagaa tatggagctt catcgaatca ccggcagtaa gcgaaggaga atgtgaagcc 17040 
aggggtgtat agccgtcggc gaaatagcat gccattaacc taggtacaga agtccaattg 17100 
cttccgatct ggtaaaagat tcacgagata gtaccttctc cgaagtaggt agagcgagta 17160 
cccggcgcgt aagctcccta attggcccat ccggcatctg tagggcgtcc aaatatcgtg 17220 
cctctcctgc tttgcccggt gtatgaaacc ggaaaggccg ctcaggagct ggccagcggc 17280 
gcagaccggg aacacaagct ggcagtcgac ccatccggtg ctctgcactc gacctgctga 17340 
ggtccctcag tccctggtag gcagctttgc cccgtctgtc cgcccggtgt gtcggcgggg 17400 
ttgacaaggt cgttgcgtca gtccaacatt tgttgccata ttttcctgct ctccccacca 17460 
gctgctcttt tcttttctct ttcttttccc atcttcagta tattcatctt cccatccaag 17520 
aacctttatt tcccctaagt aagtactttg ctacatccat actccatcct tcccatccct 17580 
tattcctttg aacctttcag ttcgagcttt cccacttcat cgcagcttga ctaacagcta 17640 
ccccgcttga gcagacatca ccatgcctga actcaccgcg acgtctgtcg agaagtttct 17700 
gatcgaaaag ttcgacagcg tctccgacct gatgcagctc tcggagggcg aagaatctcg 17760 
tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg cgggtaaata gctgcgccga 17820 
tggtttctac aaagatcgtt atgtttatcg gcactttgca tcggccgcgc tcccgattcc 17880 
ggaagtgctt gacattgggg aattcagcga gagcctgacc tattgcatct cccgccgtgc 17940 
acagggtgtc acgttgcaag acctgcctga aaccgaactg cccgctgttc tgcagccggt 18000 
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cgcggaggcc atggatgcga tcgctgcggc cgatcttagc cagacgagcg ggttcggccc 18060 
attcggaccg caaggaatcg gtcaatacac tacatggcgt gatttcatat gcgcgattgc 18120 
tgatccccat gtgtatcact ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc 18180 
gcaggctctc gatgagctga tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt 18240 
gcacgcggat ttcggctcca acaatgtcct gacggacaat ggccgcataa cagcggtcat 18300 
tgactggagc gaggcgatgt tcggggattc ccaatacgag gtcgccaaca tcttcttctg 183 60 
gaggccgtgg ttggcttgta tggagcagca gacgcgctac ttcgagcgga ggcatccgga 18420 
gcttgcagga tcgccgcggc tccgggcgta tatgctccgc attggtcttg accaactcta 18480 
tcagagcttg gttgacggca atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc 18540 
aatcgtccga tccggagccg ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc 18600 
cgtctggacc gatggctgtg tagaagtact cgccgatagt ggaaaccgac gccccagcac 18660 
tcgtccgagg gcaaaggaat agagtagatg ccgaccgcgg gatcgatcca cttaacgtta 18720 
ctgaaatcat caaacagctt gacgaatctg gatataagat cgttggtgtc gatgtcagct 18780 
ccggagttga gacaaatggt gttcaggatc tcgataagat acgttcattt gtccaagcag 18840 
caaagagtgc cttctagtga tttaatagct ccatgtcaac aagaataaaa cgcgttttcg 18900 
ggtttacctc ttccagatac agctcatctg caatgcatta atgcattgac tgcaacctag 18960 
taacgccttn caggctccgg cgaagagaag aatagcttag cagagctatt ttcattttcg 19020 
ggagacgaga tcaagcagat caacggtcgt caagagacct acgagactga ggaatccgct 19080 
cttggctcca cgcgactata tatttgtctc taattgtact ttgacatgct cctcttcttt 19140 
actctgatag cttgactatg aaaattccgt caccagcncc tgggttcgca aagataattg 19200 
catgtttctt ccttgaactc tcaagcctac aggacacaca ttcatcgtag gtataaacct 19260 
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cgaaatcant tcctactaag atggtataca atagtaacca tgcatggttg cctagtgaat 19320 

gctccgtaac acccaatacg ccggccgaaa cttttttaca actctcctat gagtcgttta 19380 

cccagaatgc acaggtacac ttgtttagag gtaatccttc tttctagcta gaagtcctcg 19440 

tgtactgtgt aagcgcccac tccacatctc cactcgacct gcaggcatgc a 19491 
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<400> 46 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 
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tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 
tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 
caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 
cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 
aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 
gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 
ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 
aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 
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tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 
cgaaatagca tgccattaac cfcaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 
ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 
aattggccca tccggcatct gfcagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 
tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 
tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 
ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 
agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 
tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 
taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 
gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 
accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 
gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 
ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 
tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 
gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 
gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 
atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 
ggtcaataca ctaoatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 
tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 
atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 
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aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 37 80 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caagcttgaa ttcgagctcg gtacccgggg 4020 
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atctttcgac actgaaatac gtcgagcctg ctccgcttgg aagcggcgag gagcctcgtc 4080 

ctgtcacaac taccaacatg gagtacgata agggccagtt ccgccagctc attaagagcc 4140 

agttcatggg cgttggcatg atggccgtca tgcatctgta cttcaagtac accaacgctc 4200 

ttctgatcca gtcgatcatc cgctgaaggc gctttcgaat ctggttaaga tccacgtctt 4260 

cgggaagcca gcgactggtg acctccagcg tccctttaag gctgccaaca gctttctcag 4320 

ccagggccag cccaagaccg acaaggcctc cctccagaac gccgagaaga actggagggg 4380 

tggtgtcaag gaggagtaag ctccttattg aagtcggagg acggagcggt gtcaagagga 4440 

tattcttcga ctctgtatta tagataagat gatgaggaat tggaggtagc atagcttcat 4500 

ttggatttgc tttccaggct gagactctag cttggagcat agagggtcct ttggctttca 4560 

atattctcaa gtatctcgag tttgaactta ttccctgtga accttttatt caccaatgag 4620 

cattggaatg aacatgaatc tgaggactgc aatcgccatg aggttttcga aatacatccg 4680 

gatgtcgaag gcttggggca cctgcgttgg ttgaatttag aacgtggcac tattgatcat 4740 

ccgatagctc tgcaaagggc gttgcacaat gcaagtcaaa cgttgctagc agttccaggt 4800 

ggaatgttat gatgagcatt gtattaaatc aggagatata gcatgatctc tagttagctc 4860 

accacaaaag tcagacggcg taaccaaaag tcacacaaca caagctgtaa ggatttcggc 4920 

acggctacgg aagacggaga agccaccttc agtggactcg agtaccattt aattctattt 4980 

gtgtttgatc gagacctaat acagccccta caacgaccat caaagtcgta tagctaccag 5040 
tgaggaagtg gactcaaatc gacttcagca acatctcctg gataaacttt aagcctaaac 5100 
tatacagaat aagataggtg gagagcttat accgagctcc caaatctgtc cagatcatgg 5160 
ttgaccggtg cctggatctt cctatagaat catccttatt cgttgaccta gctgattctg 5220 
gagtgaccca gagggtcatg acttgagcct aaaatccgcc gcctccacca tttgtagaaa 5280 
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aatgtgacga actcgtgagc tctgtacagt gaccggtgac tctttctggc atgcggagag 5340 

acggacggac gcagagagaa gggctgagta ataagccact ggccagacag ctctggcggc 5400 

tctgaggtgc agtggatgat tattaatccg ggaccggccg cccctccgcc ccgaagtgga 5460 

aaggctggtg tgcccctcgt tgaccaagaa tctattgcat catcggagaa tatggagctt 5520 

catcgaatca ccggcagtaa gcgaaggaga atgtgaagcc aggggtgtat agccgtcggc 5580 

gaaatagcat gccattaacc taggtacaga agtccaattg cttccgatct ggtaaaagat 5640 

tcacgagata gtaccttctc cgaagtaggt agagcgagta cccggcgcgt aagctcccta 5700 

attggcccat ccggcatctg tagggcgtcc aaatatcgtg cctctcctgc tttgcccggt 5760 

gtatgaaacc ggaaaggccg ctcaggagct ggccagcggc gcagaccggg aacacaagct 5820 
ggcagtcgac ccatccggtg ctctgcactc gacctgctga ggtccctcag tccctggtag 5880 
gcagctttgc cccgtctgtc cgcccggtgt gtcggcgggg ttgacaaggt cgttgcgtca 5940 
gtccaacatt tgttgccata ttttcctgct ctccccacca gctgctcttt tcttttctct 6000 
ttcttttccc atcttcagta tattcatctt cccatccaag aacctttatt tcccctaagt 6060 
aagtactttg ctacatccat actccatcct tcccatccct tattcctttg aacctttcag 6120 
ttcgagcttt cccacttcat cgcagcttga ctaacagcta ccccgcttga gcagacatca 6180 
ccatgtcaat actcacttat ctggaatttc atctctacta tacactacct gtccttgcgg 6240 
cattgtgttg gctgctaaag ccgtttcact cacagcaaga caatctcaag tataaatttt 6300 
taatgttgat ggccgcctct accgcatcga tttgggacaa ttatatcgtt tatcatcgcg 6360 
cttggtggta ctgtcctact tgtgttgtgg ctgtcattgg ctatgtacct ctagaagaat 6420 
acatgttctt tatcatcatg actttaatga ctgtcgcgtt ctcaaacttt gttatgcgtt 6480 
ggcacttgca tactttcttt attagaccca acacttcttg gaagcaaaca ctattagtac 6540 
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gccttgtgcc tgtttcagct ttattggcaa tcacttatca tgcttggcac ttgacactgc 6600 

caaataaacc ttcattttat ggttcatgca tcctttggta tgcttgtcct gtgttggcta 6660 

ttctttggct gggtgctggc gaatatatct tgcgtcgacc tgtggctgtc cttttgtcta 6720 

ttgttatccc tagtgtatac ctatgttggg ctgatatcgt cgctattagt gctggcacat 6780 

ggcatatttc tcttagaaca agcactggca aaatggtagt acccgattta cctgtagaag 6840 

aatgcctgtt ttttactttg atcaacacag tcttggtttt tgctacctgt gctatagacc 6900 

gcgctcaggc catcctccat gtgagcgcgc gtaatacgac tcactatagg gcgaattgga 6960 

gctccaccgc ggtggcggcc gctctagaac tagtggatcc cccgggctgc aggaattcgg 7020 

cacgagctac atttcacaag cccgtgagcg gtgcaagcgc tctgccccac atcggcccac 7080 

ctcctcatct ccatcggtca tttgctgcta ccacgatgct gtcgaagctg cagtcaatca 7140 

gcgtcaaggc ccgccgcgtt gaactagccc gcgacatcac gcggcccaaa gtctgcctgc 7200 

atgctcagcg gtgctcgtta gttcggctgc gagtggcagc accacagaca gaggaggcgc 7260 

tgggaaccgt gcaggctgcc ggcgcgggcg atgagcacag cgccgatgta gcactccagc 7320 

agcttgaccg ggctatcgca gagcgtcgtg cccggcgcaa acgggagcag ctgtcatacc 7380 

aggctgccgc cattgcagca tcaattggcg tgtcaggcat tgccatcttc gccacctacc 7440 

tgagatttgc catgcacatg accgtgggcg gcgcagtgcc atggggtgaa gtggctggca 7500 

ctctcctctt ggtggttggt ggcgcgctcg gcatggagat gtatgcccgc tatgcacaca 7560 

aagccatctg gcatgagtcg cctctgggct ggctgctgca caagagccac cacacacctc 7620 

gcactggacc ctttgaagcc aacgacttgt ttgcaatcat caatggactg cccgccatgc 7680 

tcctgtgtac ctttggcttc tggctgccca acgtcctggg ggcggcctgc tttggagcgg 7740 
ggctgggcat cacgctatac ggcatggcat atatgtttgt acacgatggc ctggtgcaca 7800 
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ggcgctttcc caccgggccc atcgctggcc tgccctacat gaagcgcctg acagtggccc 7860 

accagctaca ccacagcggc aagtacggtg gcgcgccctg gggtatgttc ttgggtccac 7920 

aggagctgca gcacattcca ggtgcggcgg aggaggtgga gcgactggtc ctggaactgg 7980 

actggtccaa gcgggctcag gccatcctcc atctgtacaa atcatctgtt caaaatcaaa 8040 

accctaaaca agccatttcc cttttccagc atgtcaaaga gctagcatgg gccttctgtc 8100 

ttcctgacca aatgctcaac aatgaattgt ttgatgatct tactatcagc tgggatattt 8160 

tacgtaaagc ctcaaagtca ttctatactg catctgccgt ttttccaagt tatgtacgtc 8220 

aagacttggg tgttctctat gctttctgca gagctaccga tgacctgtgc gatgatgaat 8280 

ccaaatctgt tcaagaaaga agagaccaat tagatcttac tcgacaattt gttcgtgatc 8340 

tctttagcca aaagaccagt gcgcctattg tgattgattg ggaattgtat caaaaccaac 8400 

ttcctgcttc ttgtatatca gcctttagag cctttactcg ccttcgccat gtccttgaag 8460 

tagaccctgt agaagaacta ttagatggtt acaaatggga tcttgagcgt cgtcctatcc 8520 

ttgatgaaca agacttggag gcatactctg cttgtgtggc cagtagtgtg ggtgaaatgt 8580 

gcacacgtgt gattcttgct caagaccaaa aggaaaatga tgcttggata attgaccgtg 8640 
cacgtgagat ggggctggtg ctacaatacg ttaacattgc tcgagacatt gtgactgata 8700 
gcgagactct gggtcgatgt tatctgcctc aadaatggct tagaaaagaa gaaacagaac 8760 
aaatacagca aggcaacgcc cgtagcctag gtgatcaaag actgttgggc ttgtctctga 8820 
agcttgtagg aaaggcagac gctatcatgg tgagagctaa gaagggcatt gacaagttgc 8880 
cggcaaactg tcaaggcggt gtacgagctg cttgccaagt atatgctgca attggatctg 8940 
tactcaagca gcagaagaca acatatccta caagagctca tctaaaagga agcgaacgtg 9000 
ccaagattgc tctgttgagt gtatacaacc tctatcaatc tgaagacaag cctgtggctc 9060 
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tccgtcaagc tagaaagatt aagagttttt ttgttgatta gtgaattttt gttttattta 9120 

tgtctgatag ttcaataaag agacaacaca tacaatataa aatcattgtc tttaaatgtt 9180 

aatttagtag agtgtaaagc ctgcattttt tttgtacgca taaacaatga gttcaccccg 9240 

cttctggttt ttaaataatt atgtcaaact agggaaaatt cttttttttc tcttcgttct 9300 

ttttttggct tgttgtggag tcacaggctt gtcttcagat tgatagaggt tgtatacact 9360 

caacagagca atcttggcac gttcgcttcc ttttagatga gctcttgtag gatatgttgt 9420 

cttctgctgc ttgagtacag atccaattgc agcatatact tggcaagcag ctcgtacacc 9480 

gccttgacag tttgccggca acttgtcaat gcccttctta gctctcacca tgatagcgtc 9540 

tgcctttcct acaagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta 9600 

tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 9660 

ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 9720 

aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 97 80 

tattgggcca aagacaaaag. ggcgacattc aaccgattga gggagggaag gtaaatattg 9840 

acggaaatta ttcattaaag gtgaattatc accgtcaccg acttgagcca tttgggaatt 9900 

agagccagca aaatcaccag tagcaccatt accattagca aggccggaaa cgtcaccaat 9960 

gaaaccatcg atagcagcac cgtaatcagt agcgacagaa tcaagtttgc ctttagcgtc 10020 

agactgtagc gcgttttcat cggcattttc ggtcatagcc cccttattag cgtttgccat 10080 

cttttcataa tcaaaatcac cggaaccaga gccaccaccg gaaccgcctc cctcagagcc 10140 

gccaccctca gaaccgccac cctcagagcc accaccctca gagccgccac cagaaccacc 10200 

accagagccg ccgccagcat tgacaggagg cccgatctag taacatagat gacaccgcgc 10260 

gcgataattt atcctagttt gcgcgctata ttttgttttc tatcgcgtat taaatgtata 10320 
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attgcgggac tctaatcata aaaacccatc tcataaataa cgtcatgcat tacatgttaa 10380 
ttattacatg cttaacgtaa ttcaacagaa attatatgat aatcatcgca agaccggcaa 10440 
caggattcaa tcttaagaaa ctttattgcc aaatgtttga acgatcgggg atcatccggg 10500 
tctgtggcgg gaactccacg aaaatatccg aacgcagcaa gatatcgcgg tgcatctcgg 10560 
tcttgcctgg gcagtcgccg ccgacgccgt tgatgtggac gccgggcccg atcatattgt 10620 
cgctcaggat cgtggcgttg tgcttgtcgg ccgttgctgt cgtaatgata tcggcacctt 10680 
cgaccgcctg ttccgcagag atcccgtggg cgaagaactc cagcatgaga tccccgcgct 10740 
ggaggatcat ccagccggcg tcccggaaaa cgattccgaa gcccaacctt tcatagaagg 10800 
cggcggtgga atcgaaatct cgtgatggca ggttgggcgt cgcttggtcg gtcatttcga 10860 
accccagagt cccgctcaga agaactcgtc aagaaggcga tagaaggcga tgcgctgcga 10920 
atcgggagcg gcgataccgt aaagcacgag gaagcggtca gcccattcgc cgccaagctc 10980 
ttcagcaata tcacgggtag ccaacgctat gtcctgatag cggtccgcca cacccagccg 11040 
gccacagtcg atgaatccag aaaagcggcc attttccacc atgatattcg gcaagcaggc 11100 
atcgccatgg gtcacgacga gatcatcgcc gtcgggcatg cgcgccttga gcctggcgaa 11160 
cagttcggct ggcgcgagcc cctgatgctc ttcgtccaga tcatcctgat cgacaagacc 11220 
ggcttccatc cgagtacgtg ctcgctcgat gcgatgtttc gcttggtggt cgaatgggca 11280 
ggtagccgga tcaagcgtat gcagccgccg cattgcatca gccatgatgg atactttctc 11340 
ggcaggagca aggtgagatg acaggagatc ctgccccggc acttcgccca atagcagcca 11400 
gtcccttccc gcttcagtga caacgtcgag cacagctgcg caaggaacgc ccgtcgtggc 11460 
cagccacgat agccgcgctg cctcgtcctg cagttcattc agggcaccgg acaggtcggt 11520 
cttgacaaaa agaaccgggc gcccctgcgc tgacagccgg aacacggcgg catcagagca 11580 
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gccgattgtc tgttgtgccc agtcatagcc gaatagcctc tccacccaag cggccggaga 11640 
acctgcgtgc aatccatctt gttcaatcat gcgaaacgat ccagatccgg tgcagattat 11700 
ttggattgag agtgaatatg agactctaat tggataccga ggggaattta tggaacgtca 11760 
gtggagcatt tttgacaaga aatatttgct agctgatagt gaccttaggc gacttttgaa 11820 
cgcgcaataa tggtttctga cgtatgtgct tagctcatta aactccagaa acccgcggct 11880 
gagtggctcc ttcaacgttg cggttctgtc agttccaaac gtaaaacggc ttgtcccgcg 11940 
tcatcggcgg gggtcataac gtgactccct taattctccg ctcatgatca gattgtcgtt 12000 
tcccgccttc agtttaaact atcagtgttt gacaggatat attggcgggt aaacctaaga 12060 
gaaaagagcg tttattagaa taatcggata tttaaaaggg cgtgaaaagg tttatccgtt 12120 
cgtccatttg tatgtgcatg ccaaccacag ggttccccag atctggcgcc ggccagcgag 12180 
acgagcaaga ttggccgccg cccgaaacga tccgacagcg cgcccagcac aggtgcgcag 12240 
gcaaattgca ccaacgcata cagcgccagc agaatgccat agtgggcggt gacgtcgttc 12300 
gagtgaacca gatcgcgcag gaggcccggc agcaccggca taatcaggcc gatgccgaca 12360 
gcgtcgagcg cgacagtgct cagaattacg atcaggggta tgttgggttt cacgtctggc 12420 
ctccggacca gcctccgctg gtccgattga acgcgcggat tctttatcac tgataagttg 12480 
gtggacatat tatgtttatc agtgataaag tgtcaagcat gacaaagttg cagccgaata 12540 
cagtgatccg tgccgccctg gacctgttga acgaggtcgg cgtagacggt ctgacgacac 12600 
gcaaactggc ggaacggttg ggggttcagc agccggcgct ttactggcac ttcaggaaca 12660 
agcgggcgct gctcgacgca ctggccgaag ccatgctggc ggagaatcat acgcattcgg 12720 
tgccgagagc cgacgacgac tggcgctcat ttctgatcgg gaatgcccgc agcttcaggc 12780 
aggcgctgct cgcctaccgc gatggcgcgc gcatccatgc cggcacgcga ccgggcgcac 12840 
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cgcagatgga aacggccgac gcgcagcttc gcttcctctg cgaggcgggt ttttcggccg 12900 
gggacgccgt caatgcgctg atgacaatca gctacttcac tgttggggcc gtgcttgagg 12960 
agcaggccgg cgacagcgat gccggcgagc gcggcggcac cgttgaacag gctccgctct 13020 
cgccgctgtt gcgggccgcg atagacgcct tcgacgaagc cggtccggac gcagcgttcg 13080 
agcagggact cgcggtgatt gtcgatggat tggcgaaaag gaggctcgtt gtcaggaacg 13140 
ttgaaggacc gagaaagggt gacgattgat caggaccgct gccggagcgc aacccactca 13200 
ctacagcaga gccatgtaga caacatcccc tccccctttc caccgcgtca gacgcccgta 13260 
gcagcccgct acgggctttt tcatgccctg ccctagcgtc caagcctcac ggccgcgctc 13320 
ggcctctctg gcggccttct ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 13380 
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 13440 
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 13500 
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 13560 
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 13620 
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 13680 
cctgtccgcc tttctccctt cgggaagcgt ggcgcttttc cgctgcataa ccctgcttcg 13740 
gggtcattat agcgattttt tcggtatatc catccttttt cgcacgatat acaggatttt 13800 
gccaaagggt tcgtgtagac tttccttggt gtatccaacg gcgtcagccg ggcaggatag 13860 
gtgaagtagg cccacccgcg agcgggtgtt ccttcttcac tgtcccttat tcgcacctgg 13920 
cggtgctcaa cgggaatcct gctctgcgag gctggccggc taccgccggc gtaacagatg 13980 
agggcaagcg gatggctgat gaaaccaagc caaccaggaa gggcagccca cctatcaagg 14040 
tgtactgcct tccagacgaa cgaagagcga ttgaggaaaa ggcggcggcg gccggcatga 14100 
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gcctgtcggc ctacctgctg gccgtcggcc agggctacaa aatcacgggc gtcgtggact 14160 
atgagcacgt ccgcgagctg gcccgcatca atggcgacct gggccgcctg ggcggcctgc 14220 
tgaaactctg gctcaccgac gacccgcgca cggcgcggtt cggtgatgcc acgatcctcg 14280 
ccctgctggc gaagatcgaa gagaagcagg acgagcttgg caaggtcatg atgggcgtgg 14340 
tccgcccgag ggcagagcca tgactttttt agccgctaaa acggccgggg ggtgcgcgtg 14400 
attgccaagc acgtccccat gcgctccatc aagaagagcg acttcgcgga gctggtgaag 14460 
tacatcaccg acgagcaagg caagaccgag cgcctttgcg acgctcaccg ggctggttgc 14520 
cctcgccgct gggctggcgg ccgtctatgg ccctgcaaac gcgccagaaa cgccgtcgaa 14580 
gccgtgtgcg agacaccgcg gccgccggcg ttgtggatac ctcgcggaaa acttggccct 14640 
cactgacaga tgaggggcgg acgttgacac ttgaggggcc gactcacccg gcgcggcgtt 14700 
gacagatgag gggcaggctc gatttcggcc ggcgacgtgg agctggccag cctcgcaaat 14760 
cggcgaaaac gcctgatttt acgcgagttt cccacagatg atgtggacaa gcctggggat 14820 
aagtgccctg cggtattgac acttgagggg cgcgactact gacagatgag gggcgcgatc 14880 
cttgacactt gaggggcaga gtgctgacag atgaggggcg cacctattga catttgaggg 14940 
gctgtccaca ggcagaaaat ccagcatttg caagggtttc cgcccgtttt tcggccaccg 15000 
ctaacctgtc ttttaacctg cttttaaacc aatatttata aaccttgttt ttaaccaggg 15060 
ctgcgccctg tgcgcgtgac cgcgcacgcc gaaggggggt gccccccctt ctcgaaccct 15120 
cccggcccgc taacgcgggc ctcccatccc cccaggggct gcgcccctcg gccgcgaacg 15180 
gcctcacccc aaaaatggca gcgctggcag tccttgccat tgccgggatc ggggcagtaa 15240 
cgggatgggc gatcagcccg agcgcgacgc ccggaagcat tgacgtgccg caggtgctgg 15300 
catcgacatt cagcgaccag gtgccgggca gtgagggcgg cggcctgggt ggcggcctgc 15360 
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ccttcacttc ggccgtcggg gcattcacgg acttcatggc ggggccggca atttttacct 15420 
tgggcattct tggcatagtg gtcgcgggtg ccgtgctcgt gttcgggggt gcgataaacc 15480 
cagcgaacca tttgaggtga taggtaagat tataccgagg tatgaaaacg agaattggac 15540 
ctttacagaa ttactctatg aagcgccata tttaaaaagc taccaagacg aagaggatga 15600 
agaggatgag gaggcagatt gccttgaata tattgacaat actgataaga taatatatct 15660 
tttatataga agatatcgcc gtatgtaagg atttcagggg gcaaggcata ggcagcgcgc 15720 
ttatcaatat atctatagaa tgggcaaagc ataaaaactt gcatggacta atgcttgaaa 15780 
cccaggacaa taaccttata gcttgtaaat tctatcataa ttgggtaatg actccaactt 15840 
attgatagtg ttttatgttc agataatgcc cgatgacttt gtcatgcagc tccaccgatt 15900 
ttgagaacga cagcgacttc cgtcccagcc gtgccaggtg ctgcctcaga ttcaggttat 15960 
gccgctcaat tcgctgcgta tatcgcttgc tgattacgtg cagctttccc ttcaggcggg 16020 
attcatacag cggccagcca tccgtcatcc atatcaccac gtcaaagggt gacagcaggc 16080 
tcataagacg ccccagcgtc gccatagtgc gttcaccgaa tacgtgcgca acaaccgtct 16140 
tccggagact gtcatacgcg taaaacagcc agcgctggcg cgatttagcc ccgacatagc 16200 
cccactgttc gtccatttcc gcgcagacga tgacgtcact gcccggctgt atgcgcgagg 16260 
ttaccgactg cggcctgagt tttttaagtg acgtaaaatc gtgttgaggc caacgcccat 16320 
aatgcgggct gttgcccggc atccaacgcc attcatggcc atatcaatga ttttctggtg 16380 
cgtaccgggt tgagaagcgg tgtaagtgaa ctgcagttgc catgttttac ggcagtgaga 16440 
gcagagatag cgctgatgtc cggcggtgct tttgccgtta cgcaccaccc cgtcagtagc 16500 
tgaacaggag ggacagctga tagacacaga agccactgga gcacctcaaa aacaccatca 16560 
tacactaaat cagtaagttg gcagcatcac ccataattgt ggtttcaaaa tcggctccgt 16620 
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cgatactatg ttatacgcca actttgaaaa caactttgaa aaagctgttt tctggtattt 16680 
aaggttttag aatgcaagga acagtgaatt ggagttcgtc ttgttataat tagcttcttg 16740 
gggtatcttt aaatactgta gaaaagagga aggaaataat aaatggctaa aatgagaata 16800 
tcaccggaat tgaaaaaact gatcgaaaaa taccgctgcg taaaagatac ggaaggaatg 16860 
tctcctgcta aggtatataa gctggtggga gaaaatgaaa acctatattt aaaaatgacg 16920 
gacagccggt ataaagggac cacctatgat gtggaacggg aaaaggacat gatgctatgg 16980 
ctggaaggaa agctgcctgt tccaaaggtc ctgcactttg aacggcatga tggctggagc 17040 
aatctgctca tgagtgaggc cgatggcgtc ctttgctcgg aagagtatga agatgaacaa 17100 
agccctgaaa agattatcga gctgtatgcg gagtgcatca ggctctttca ctccatcgac 17160 
atatcggatt gtccctatac gaatagctta gacagccgct tagccgaatt ggattactta 17220 
ctgaataacg atctggccga tgtggattgc gaaaactggg aagaagacac tccatttaaa 17280 
gatccgcgcg agctgtatga ttttttaaag acggaaaagc ccgaagagga acttgtcttt 17340 
tcccacggcg acctgggaga cagcaacatc tttgtgaaag atggcaaagt aagtggcttt 17400 
attgatcttg ggagaagcgg cagggcggac aagtggtatg acattgcctt ctgcgtccgg 17460 
tcgatcaggg aggatatcgg ggaagaacag tatgtcgagc tattttttga cttactgggg 17520 
atcaagcctg attgggagaa aataaaatat tatattttac tggatgaatt gttttagtac 17580 
ctagatgtgg cgcaacgatg ccggcgacaa gcaggagcgc accgacttct tccgcatcaa 17640 
gtgttttggc tctcaggccg aggcccacgg caagtatttg ggcaaggggt cgctggtatt 17700 
cgtgcagggc aagattcgga ataccaagta cgagaaggac ggccagacgg tctacgggac 17760 
cgacttcatt gccgataagg tggattatct ggacaccaag gcaccaggcg ggtcaaatca 17820 
ggaataaggg cacattgccc cggcgtgagt cggggcaatc ccgcaaggag ggtgaatgaa 17880 
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tcggacgttt gaccggaagg catacaggca agaactgatc gacgcggggt tttccgccga 17940 
ggatgccgaa accatcgcaa gccgcaccgt catgcgtgcg ccccgcgaaa ccttccagtc 18000 
cgtcggctcg atggtccagc aagctacggc caagatcgag cgcgacagcg tgcaactggc 18060 
tccccctgcc ctgcccgcgc catcggccgc cgtggagcgt tcgcgtcgtc tcgaacagga 18120 
ggcggcaggt ttggcgaagt cgatgaccat cgacacgcga ggaactatga cgaccaagaa 18180 
gcgaaaaacc gccggcgagg acctggcaaa acaggtcagc gaggccaagc aggccgcgtt 18240 
gctgaaacac acgaagcagc agatcaagga aatgcagctt tccttgttcg atattgcgcc 18300 
gtggccggac acgatgcgag cgatgccaaa cgacacggcc cgctctgccc tgttcaccac 18360 
gcgcaacaag aaaatcccgc gcgaggcgct gcaaaacaag gtcattttcc acgtcaacaa 18420 
ggacgtgaag atcacctaca ccggcgtcga gctgcgggcc gacgatgacg aactggtgtg 18480 
gcagcaggtg ttggagtacg cgaagcgcac ccctatcggc gagccgatca ccttcacgtt 18540 
ctacgagctt tgccaggacc tgggctggtc gatcaatggc cggtattaca cgaaggccga 18600 
ggaatgcctg tcgcgcctac aggcgacggc gatgggcttc acgtccgacc gcgttgggca 18660 
cctggaatcg gtgtcgctgc tgcaccgctt ccgcgtcctg gaccgtggca agaaaacgtc 18720 
ccgttgccag gtcctgatcg acgaggaaat cgtcgtgctg tttgctggcg accactacac 18780 
gaaattcata tgggagaagt accgcaagct gtcgccgacg gcccgacgga tgttcgacta 18840 
tttcagctcg caccgggagc cgtacccgct caagctggaa accttccgcc tcatgtgcgg 18900 
atcggattcc acccgcgtga agaagtggcg cgagcaggtc ggcgaagcct gcgaagagtt 18960 
gcgaggcagc ggcctggtgg aacacgcctg ggtcaatgat gacctggtgc attgcaaacg 19020 
ctagggcctt gtggggtcag ttccggctgg gggttcagca gccagcgctt tactggcatt 19080 
tcaggaacaa gcgggcactg ctcgacgcac ttgcttcgct cagtatcgct cgggacgcac 19140 
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ggcgcgctct acgaactgcc gataaacaga ggattaaaat tgacaattgt gattaaggct 19200 
cagattcgac ggcttggagc ggccgacgtg caggatttcc gcgagatccg attgtcggcc 19260 
ctgaagaaag ctccagagat gttcgggtcc gtttacgagc acgaggagaa aaagcccatg 19320 
gaggcgttcg ctgaacggtt gcgagatgcc gtggcattcg gcgcctacat cgacggcgag 19380 
atcattgggc tgtcggtctt caaacaggag gacggcccca aggacgctca caaggcgcat 19440 
ctgtccggcg ttttcgtgga gcccgaacag cgaggccgag gggtcgccgg tatgctgctg 19500 
cgggcgttgc cggcgggttt attgctcgtg atgatcgtcc gacagattcc aacgggaatc 19560 
tggtggatgc gcatcttcat cctcggcgca cttaatattt cgctattctg gagcttgttg 19620 
tttatttcgg tctaccgcct gccgggcggg gtcgcggcga cggtaggcgc tgtgcagccg 19680 
ctgatggtcg tgttcatctc tgccgctctg ctaggtagcc cgatacgatt gatggcggtc 19740 
ctgggggcta tttgcggaac tgcgggcgtg gcgctgttgg tgttgacacc aaacgcagcg 19800 
ctagatcctg tcggcgtcgc agcgggcctg gcgggggcgg tttccatggc gttcggaacc 19860 
gtgctgaccc gcaagtggca acctcccgtg cctctgctca cctttaccgc ctggcaactg 19920 
gcggccggag gacttctgct cgttccagta gctttagtgt ttgatccgcc aatcccgatg 19980 
cctacaggaa ccaatgttct cggcctggcg tggctcggcc tgatcggagc gggtttaacc 20040 
tacttccttt ggttccgggg gatctcgcga ctcgaaccta cagttgtttc cttactgggc 20100 
tttctcagcc ccagatctgg ggtcgatcag ccggggatgc atcaggccga cagtcggaac 20160 
ttcgggtccc cgacctgtac cattcggtga gcaatggata ggggagttga tatcgtcaac .20220 
gttcacttct aaagaaatag cgccactcag cttcctcagc ggctttatcc agcgatttcc 20280 
tattatgtcg gcatagttct caagatcgac agcctgtcac ggttaagcga gaaatgaata 20340 
agaaggctga taattcggat ctctgcgagg gagatgatat ttgatcacag gcagcaacgc 20400 
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tctgtcatcg ttacaatcaa catgctaccc tccgcgagat catccgtgtt tcaaacccgg 20460 
cagcttagtt gccgttcttc cgaatagcat cggtaacatg agcaaagtct gccgccttac 20520 
aacggctctc ccgctgacgc cgtcccggac tgatgggctg cctgtatcga gtggtgattt 20580 
tgtgccgagc tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt 20640 
aaacaaattg acgcttagac aacttaataa cacattgcgg acgtttttaa tgtactgggg 20700 
tggtttttct tttcaccagt gagacgggca acagctgatt gcccttcacc gcctggccct 20760 
gagagagttg cagcaagcgg tccacgctgg tttgccccag caggcgaaaa tcctgtttga 20820 
tggtggttcc gaaatcggca aaatccctta taaatcaaaa gaatagcccg agatagggtt 20880 
gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 20940 
agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac ccaaatcaag 21000 
ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 21060 
tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 21120 
agcgggcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 21180 
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 21240 
ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 21300 
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<221> misc_feature 
<222> (10264) . . (10264) 
<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 



<400> 47 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 
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aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 
aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 
ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 
cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 
caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 
gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 
tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 
ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 
tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 
cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 
tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 
atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 
ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 
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ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 
gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 
agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 
agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 
cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 
ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 
gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 
gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 
tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 
ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 
tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 
tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 
ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 
aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 
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aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 
cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 
ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 
agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 
cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 
tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 
attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 
tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 
ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 
cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 
gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 
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gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 
ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 
aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 
gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 
tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 
agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 
tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 
ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 
tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 
acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 
tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 
acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 
accgcgttgg g Ca cctggaa tcggtgtcgc- tgctgcaccg cttccgcgtc ctggaccgtg 42 
gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 42 
gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 
ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 
gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 
cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 
tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 
ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 
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gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 
cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg . 5220 
attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 
accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 
ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 
cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 
gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 
agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 
ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 
cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 
tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 
cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 
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caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 
cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 
gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 
gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 
aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 
aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 
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aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 
atttaattct atttgtgttfc gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 
cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 
ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 
tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 
cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 
tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 
acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 
cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 
agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 
gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 
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atctggtaaa a gattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 
ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 
accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 
ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 
tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 
ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 
gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 
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gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 
aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 
cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 
gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 
tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt cattttgctt 10800 
tgtaaatttc tggtaactgc caccaagaaa tatgaggata ttcgtgatgt tcctcgtggt 10860 
agccaaaatg atagcacgtg ataaatgacc accaaatagg acggctaatt gtttgggcac 10920 
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aatgaggctg aacataaccc cctattggtt cactatgggg taaaaaagta ccaaaataga 10980 
ataattgtaa tgaacttaaa agcgagggta gcacccaaaa gtaagttaga ttatcacttg 11040 
ggatatggag tatgtattta gcaaagttat aaataatagt caacgcaatt atttgccccc 11100 
aactccagta acctttcata aaatgaaaat accaagcaaa gaaactttgg tgtttaccat 11160 
tgtgaaaatc cgggtctatt gagcttgctg gattgtggtg gtgtaaccaa tgttttttca 11220 
atagtttttg atatggtaaa agaccataaa gggatagggt caatgttcca atcaaatgat 11280 
taatcttggt gttttgggga aatactacgc catgcatggc atcatgagat gtaataaata 11340 
atcccgtata taaaaatgtt tgccatagta taacaggcaa taacatccaa aattttagct 11400 
ttgagatgtc aagggaaagt aataaactca ggctaatgac ccatgcgcta acaatgacaa 11460 
tagcaatgaa aagcccctta aactgagatt tacttctcag tactggagtc agttttgctt 11520 
gatgactgag tggttgttct aactggatca tttctaaaga gaaggtggaa caatgttagc 11580 
ataattgtgc ttgagtgagg actttgaggg taggtacata cttgataaag ttaatgatta 11640 
aagagaaaaa aaaagttttg gttcaaagca gaaattgttt tttaaatcga ttggtgagaa 11700 
aatttttttc tgtttccgca tcaccaaagc cacctcagga atggtcacaa attattggtc 11760 
tgattggacc ataagcatac aaaaagttca ttgaagtata cttagtggct tattagactt 11820 
ttatcgtttt ctaacgcgaa tcagcaatgt ttcttgtttg atttactgct tgctttagat 11880 
catttttgtc tgaaatatta tgcatttgtt caaagcggcc tttgtttcct ttctttcatg 11940 
cttaaacacg ttgtttattc catatattac tttgaatatg catcaccgca aagcggaagt 12000 
gcaaaataac aaagaacctc tttgggttac acgatcaact gctattgtga aaaaaatttc 12060 
tttttgaaaa tttttggaat aatatctctt gcaaaaaaga aattttgtat atttagtagc 12120 
atcaagaaca aatgaaagaa gtgtgggata acaagaatac atcatcttta gacaaaagta 12180 
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cgagaaaaat ctaataagtt gttatagagg tctttgtttt ctttgtgttt atagacagtt 12240 
atttagagtt tgaaaagtgt ctctaatgtg tcttttttta ttattattat ttcaaatgtt 12300 
atgtaatata gctaaagcta tagatttgac attttttcta aatataaaat ttcagtcaac 12360 
agaaataaat gacacgagtt ctttttctct ctctcaatcc tgttgatcat caatctttga 12420 
tgtcgtttta aaacaaatga atggcattta gttccttagg tgtcactcac atcttgttga 12480 
ccagaaaatc cttattcgcc ctcaaatctg ctttattcct ttcatttgat ttgatgttta 12540 
agtaatgcaa gcaaacaaaa aagaaacctt tcttgcaaag acaaaagaat tgttttcaga 12600 
ggaaagcaac tcgttgtcat tttttaagga tttagactta taatcgacac catagtttgt 12660 
ccgttacatt ttttattgtc gttttctgat ttccttttaa tctttaagca aaatcaatat 12720 
taacttatct tgtcttccaa taaaaaatgg ataccaataa caataaatcc ttcacaaaga 12780 
aaaaaaaaaa aaactcgaaa aaagcttggc gtaatcatgg tcatagctgt ttcctgtgtg 12840 
aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc 12900 
ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 12960 
ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 13020 
cggtttgcgt attgggccaa agacaaaagg gcgacattca accgattgag ggagggaagg 13080 
taaatattga cggaaattat tcattaaagg tgaattatca ccgtcaccga cttgagccat 13140 
ttgggaatta gagccagcaa aatcaccagt agcaccatta ccattagcaa ggccggaaac 13200 
gtcaccaatg aaaccatcga tagcagcacc gtaatcagta gcgacagaat caagtttgcc 13260 
tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc ccttattagc 13320 
gtttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg aaccgcctcc 13380 
ctcagagccg ccaccctcag aaccgccacc ctcagagcca ccaccctcag agccgccacc 13440 
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agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgatctagt aacatagatg 13500 
acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttttct atcgcgtatt 13560 
aaatgtataa ttgcgggact ctaatcataa aaacccatct cataaataac gtcatgcatt 13620 
acatgttaat tattacatgc ttaacgtaat tcaacagaaa ttatatgata atcatcgcaa 13680 
gaccggcaac aggattcaat cttaagaaac tttattgcca aatgtttgaa cgatcgggga 13740 
tcatccgggt ctgtggcggg aactccacga aaatatccga acgcagcaag atatcgcggt 13800 
gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt gatgtggacg ccgggcccga 13860 
tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc cgttgctgtc gtaatgatat 13920 
cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc gaagaactcc agcatgagat 13980 
ccccgcgctg gaggatcatc cagccggcgt cccggaaaac gattccgaag cccaaccttt 14040 
catagaaggc ggcggtggaa tcgaaatctc gtgatggcag gttgggcgtc gcttggtcgg 14100 
tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat agaaggcgat 14160 
gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc 14220 
gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac 14280 
acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg 14340 
caagcaggca tcgccatggg tcacgacgag atcatcgccg tcgggcatgc gcgccttgag 14400 
cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc 14460 
gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc 14520 
gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga 14580 
tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa 14640 
tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc 14700 
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cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga 14760 
caggt cggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc 14820 
atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc 14880 
ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc cagatccggt 14940 
gcagattatt tggattgaga gtgaafcatga gactctaatt ggataccgag gggaatttat 15000 
ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagtg accttaggcg 15060 
acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa actccagaaa 15120 
cccgcggctg agtggctcct tcaacgttgc ggttctgtca gttccaaacg taaaacggct 15180 
tgtcccgcgt catcggcggg ggtcataacg tgactccctt aattctccgc tcatgatcag 15240 
attgtcgttt C ccgccttca gtttaaacta tcagtgtttg acaggatata ttggcgggta 153 
aacctaagag aaaagagcgt ttattagaat aatcggatat ttaaaagggc gtgaaaaggt 153 
ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttccccaga tctggcgccg 1542 
gccagcgaga cgagcaagat tggccgccgc ccgaaacgat ccgacagcgc gcccagcaca 15480 
ggtgcgcagg caaattgcac caacgcatac agcgccagca gaatgccata gtgggcggtg 15540 
acgtcgttcg agtgaaccag atcgcgcagg aggcccggca gcaccggcat aatcaggccg 15600 
atgccgacag cgtcgagcgc gacagtgctc agaattacga tcaggggtat gttgggtttc 15660 
acgtctggcc tccggaccag cctccgctgg tccgattgaa cgcgcggatt ctttatcact 15720 
gataagttgg tggacatatt atgtttatca gtgataaagt gtcaagcatg acaaagttgc 15780 
agccgaatac agtgatccgt gccgccctgg acctgttgaa cgaggtcggc gtagacggtc 15840 
tgacgacacg caaactggcg gaacggttgg gggttcagca gccggcgctt tactggcact 15900 
tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc catgctggcg gagaatcata 15960 
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cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg aatgcccgca 16020 
gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg catccatgcc ggcacgcgac 16080 
cgggcgcacc gcagatggaa acggccgacg cgcagcttcg cttcctctgc gaggcgggtt 16140 
tttcggccgg ggacgccgtc aatgcgctga tgacaatcag ctacttcact gttggggccg 16200 
tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc gttgaacagg 16260 
ctccgctctc gccgctgttg cgggccgcga tagacgcctt cgacgaagcc ggtccggacg 16320 
cagcgttcga gcagggactc gcggtgattg tcgatggatt ggcgaaaagg aggctcgttg 16380 
tcaggaacgt tgaaggaccg agaaagggtg acgattgatc aggaccgctg ccggagcgca 16440 
acccactcac tacagcagag ccatgtagac aacatcccct ccccctttcc accgcgtcag 16500 
acgcccgtag cagcccgcta cgggcttttt catgccctgc cctagcgtcc aagcctcacg 16560 
gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc tcactgactc 16620 
gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 16680 
gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 16740 
ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 16800 
cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 16860 
ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 16920 
taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgcttttcc gctgcataac 16980 
cctgcttcgg ggtcattata gcgatttttt cggtatatcc atcctttttc gcacgatata 17040 
caggattttg ccaaagggtt cgtgtagact ttccttggtg tatccaacgg cgtcagccgg 17100 
gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc cttcttcact gtcccttatt 17160 
cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg ctggccggct accgccggcg 17220 
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taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag ggcagcccac 
ctatcaaggt gtactgcctt ccagacgaac gaagagcgat tgaggaaaag gcggcggcgg 
ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca gggctacaaa atcacgggcg 
tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg ggccgcctgg 
gcggcctgct gaaactctgg ctcaccgacg acccgcgcac ggcgcggttc ggtgatgcca 
cgatcctcgc cctgctggcg aagatcgaag agaagcagga cgagcttggc aaggtcatga 
tgggcgtggt ccgcccgagg gcagagccat gactttttta gccgctaaaa cggccggggg 
gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga cttcgcggag 
ctggtgaagt acatcaccga cgagcaaggc aagaccgagc gcctttgcga cgctca 
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<223> n is a, c, g, or t 
<400> 48 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 
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ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 
ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 
tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 
tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 
ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 
aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 
aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 
ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 
aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 
taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 
tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 
tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 
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catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 
gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 
ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 
aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 
gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 
tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 
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agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 
ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 
gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 
- catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 
tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 
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cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag. tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 



WO 2004/063359 PCT/EP2004/000099 

266/357 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaacbgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 
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gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 
tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 
acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 
cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 
agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 
gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 
atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 
gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 
ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 
cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 
tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 
aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 
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cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 
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tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagfc gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 
tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 
atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 
aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 
acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 
atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 
tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 
cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 
ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 
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tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 
tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt attttatctc 11400 
tatgatccag ttagaacaac cactcagtca tcaagcaaaa ctgactccag tactgagaag 11460 
taaatctcag tttaaggggc ttttcattgc tattgtcatt gttagcgcat gggtcattag 11520 
cctgagttta ttactttccc ttgacatctc aaagctaaaa ttttggatgt tattgcctgt 11580 
tatactatgg caaacatttt tatatacggg attatttatt acatctcatg atgccatgca 11640 
tggcgtagta tttccccaaa acaccaagat taatcatttg attggaacat tgaccctatc 11700 
cctttatggt cttttaccat atcaaaaact attgaaaaaa cattggttac accaccacaa 11760 
tccagcaagc tcaatagacc cggattttca caatggtaaa caccaaagtt tctttgcttg 11820 
gtattttcat tttatgaaag gttactggag ttgggggcaa ataattgcgt tgactattat 11880 
ttataacttt gctaaataca tactccatat cccaagtgat aatctaactt acttttgggt 11940 
gctaccctcg cttttaagtt cattacaatt attctatttt ggtacttttt taccccatag 12000 
tgaaccaata gggggttatg ttcagcctca ttgtgcccaa acaattagcc gtcctatttg 12060 
gtggtcattt atcacgtgct atcattttgg ctaccacgag gaacatcacg aatatcctca 12120 
tatttcttgg tggcagttac cagaaattta caaagcaaaa tagaagcttg gcgtaatcat 12180 
gg'tcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 12240 
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 12300 
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 123 60 
tcggccaacg cgcggggaga ggcggtttgc gtattgggcc aaagacaaaa gggcgacatt 12420 
caaccgattg agggagggaa ggtaaatatt gacggaaatt attcattaaa ggtgaattat 12480 
caccgtcacc gacttgagcc atttgggaat tagagccagc aaaatcacca gtagcaccat 12540 
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taccattagc aaggccggaa acgtcaccaa tgaaaccatc gatagcagca ccgtaatcag 12600 
tagcgacaga atcaagtttg cctttagcgt cagactgtag cgcgttttca tcggcatttt 12660 
cggtcatagc ccccttatta gcgtttgcca tcttttcata atcaaaatca ccggaaccag 12720 
agccaccacc ggaaccgcct ccctcagagc cgccaccctc agaaccgcca ccctcagagc 12780 
caccaccctc agagccgcca ccagaaccac caccagagcc gccgccagca ttgacaggag 12840 
gcccgatcta gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat 12900 
attttgtttt ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat 12960 
ctcataaata acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga 13020 
aattatatga taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc 13080 
caaatgtttg aacgatcggg gatcatccgg gtctgtggcg ggaactccac gaaaatatcc 13140 
gaacgcagca agatatcgcg gtgcatctcg gtcttgcctg ggcagtcgcc gccgacgccg 13200 
ttgatgtgga cgccgggccc gatcatattg tcgctcagga tcgtggcgtt gtgcttgtcg 13260 
gccgttgctg tcgtaatgat atcggcacct tcgaccgcct gttccgcaga gatcccgtgg 13320 
gcgaagaact ccagcatgag atccccgcgc tggaggatca tccagccggc gtcccggaaa 13380 
acgattccga agcccaacct ttcatagaag gcggcggtgg aatcgaaatc tcgtgatggc 13440 
aggttgggcg tcgcttggtc ggtcatttcg aaccccagag tcccgctcag aagaactcgt 13500 
caagaaggcg atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga 13560 
ggaagcggtc agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta 13620 
tgtcctgata gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc 13680 
cattttccac catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcatcgc 13740 
cgtcgggcat gcgcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct 13800 
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cttcgtccag atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga 13860 
tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc 13920 
gcattgcatc agccatgatg gatactttct cggcaggagc aaggtgagat gacaggagat 13980 
cctgccccgg cacttcgccc aatagcagcc agtcccttcc cgcttcagtg acaacgtcga 14040 
gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga tagccgcgct gcctcgtcct 14100 
gcagttcatt cagggcaccg gacaggtcgg tcttgacaaa aagaaccggg cgcccctgcg 14160 
ctgacagccg gaacacggcg gcatcagagc agccgattgt ctgttgtgcc cagtcatagc 14220 
cgaatagcct ctccacccaa gcggccggag aacctgcgtg caatccatct tgttcaatca 14280 
tgcgaaacga tccagatccg gtgcagatta tttggattga gagtgaatat gagactctaa 14340 
ttggataccg aggggaattt atggaacgtc agtggagcat ttttgacaag aaatatttgc 14400 
tagctgatag tgaccttagg cgacttttga acgcgcaata atggtttctg acgtatgtgc 14460 
ttagctcatt aaactccaga aacccgcggc tgagtggctc cttcaacgtt gcggttctgt 14520 
cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 14580 
ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac tatcagtgtt 14640 
tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat 14700 
atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 14760 
gggttcccca gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg 14820 
atccgacagc gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag 14880 
cagaatgcca tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg 14940 
cagcaccggc ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac 15000 
gatcaggggt atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg 15060 
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aacgcgcgga ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa 15120 
gtgtcaagca tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg 15180 
aacgaggtcg gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag 15240 
cagccggcgc tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa 15300 
gccatgctgg cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca 15360 
tttctgatcg ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg 15420 
cgcatccatg ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt 15480 
cgcttcctct gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc 15540 
agctacttca ctgttggggc cgtgcttgag gagcaggccg gcgacagcga tgccggcgag 15600 
cgcggcggca ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc 15660 
ttcgacgaag ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga 15720 
ttggcgaaaa ggaggctcgt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga 15780 
tcaggaccgc tgccggagcg caacccactc actacagcag agccatgtag acaacatccc 15840 
ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct 15900 
gccctagcgt ccaagcctca cggccgcgct cggcctctct ggcggccttc tggcgctctt 15960 
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16020 
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16080 
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16140 
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16200 
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 16260 
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 16320 
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tggcgctttt ccgctgcata accctgcttc ggggtcatta tagcgatttt ttcggtatat 16380 

ccatcctttt tcgcacgata tacaggattt tgccaaaggg ttcgtgtaga ctttccttgg 16440 

tgtatccaac ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggtgt 16500 

tccttcttca ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga 16560 

ggctggccgg ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag 16620 

ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg 16680 

attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc 16740 

cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc 16800 

aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc 16860 

acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag 16920 

gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt 16980 

tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat 17040 

caagaagagc gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga 17100 
gcgcctttgc gacgctca 17118 
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<400> 49 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 



60 



cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 
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cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 12 60 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 
ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 
aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 
tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 
tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 
ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 
agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 
tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 
taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 
gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 
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accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 
ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 
aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3 060 
gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 
gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 
tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 
tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 
tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 33 60 
atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 
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cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caaagcttga gattaaaata gataaggaaa 4020 

agaaagtgaa aagaaattcg gaagcatggc acattcttct ttttataaat acatgcctga 4080 

ctttcttttt ccatcgatat gatatatgca tatgatagat atacaagcaa tcttcttcaa 4140 
ggagtttgaa attttgtcct ccaggagcaa aaaaaagttt ttttttatac atgtttgtac 4200 
acaagaatag ttaccaattt gctttggtct tacgtgctgc aagtttatat cgttttcaat 42 60 
ttctttgtct ttacattttc tttgtccttt atctttcctc atttagtctt tgggagaatt 4320 
aggaaaaggg agcggaaagg taagaaatgc ttgcgtattt tactaattcg gcaaacatcc 43 80 
aatttggcaa acagcagcct gtgcaacgct ctcgagatga cagtatcttt gattacactc 4440 
taaatctcga tgacccgacc aaaaagagcg aacaaagaaa taatcttgtg cattcgaata 4500 
tgatggaaga ttttttcccc cttattctaa atgttgacat agcgtgtatg ttatataaac 4560 
aaaaagaaat tgtacaaact ttcttttctt ctctttttat tttatctcta tgctgtcgaa 4620 
gctgcagtca atcagcgtca aggcccgccg cgttgaacta gcccgcgaca tcacgcggcc 4680 
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caaagtctgc ctgcatgctc agcggtgctc gttagttcgg ctgcgagtgg cagcaccaca 4740 

gacagaggag gcgctgggaa ccgtgcaggc tgccggcgcg ggcgatgagc acagcgccga 4800 

tgtagcactc cagcagcttg accgggctat cgcagagcgt cgtgcccggc gcaaacggga 4860 

gcagctgtca taccaggctg ccgccattgc agcatcaatt ggcgtgtcag gcattgccat 4920 

cttcgccacc tacctgagat ttgccatgca catgaccgtg ggcggcgcag tgccatgggg 4980 

tgaagtggct ggcactctcc tcttggtggt tggtggcgcg ctcggcatgg agatgtatgc 5040 

ccgctatgca cacaaagcca tctggcatga gtcgcctctg ggctggctgc tgcacaagag 5100 

ccaccacaca cctcgcactg gaccctttga agccaacgac ttgtttgcaa tcatcaatgg 5160 

actgcccgcc atgctcctgt gtacctttgg cttctggctg cccaacgtcc tgggggcggc 5220 

ctgctttgga gcggggctgg gcatcacgct atacggcatg gcatatatgt ttgtacacga 5280 

tggcctggtg cacaggcgct ttcccaccgg gcccatcgct ggcctgccct acatgaagcg 5340 
cctgacagtg gcccaccagc tacaccacag cggcaagtac ggtggcgcgc cctggggtat 5400 
gttcttgggt ccacaggagc tgcagcacat tccaggtgcg gcggaggagg tggagcgact 5460 
ggtcctggaa ctggactggt ccaagcgggc gattgtgact gatagcgaga ctctgggtcg 5520 
atgttatctg cctcaacaat ggcttagaaa agaagaaaca gaacaaatac agcaaggcaa 5580 
cgcccgtagc ctaggtgatc aaagactgtt gggcttgtct ctgaagcttg taggaaaggc 5640 
agacgctatc atggtgagag ctaagaaggg cattgacaag ttgccggcaa actgtcaagg 5700 
cggtgtacga gctgcttgcc aagtatatgc tgcaattgga tctgtactca agcagcagaa 5760 
gacaacatat cctacaagag ctcatctaaa aggaagcgaa cgtgccaaga ttgctctgtt 5820 
gagtgtatac aacctctatc aatctgaaga caagcctgtg gctctccgtc aagctagaaa 5880 
gattaagagt ttttttgttg attagtgaat ttttgtttta tttatgtctg atagttcaat 5940 
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aaagagacaa cacatacaat ataaaatcat tgtctttaaa tgttaattta gtagagtgta 6000 

aagcctgcat tttttttgta cgcataaaca atgaattcac cccgcttctg gtttttaaat 6060 

aattatgtca aactagggaa aattcttttt tttctcttcg ttcttttttt .ggcttgttgt 6120 

ggagtcacag gcttgtcttc agattgatag aggttgtata cactcaacag agcaatcttg 6180 

gcacgttcgc ttccttttag atgagctctt gtaggatatg ttgtcttctg ctgcttgagt 6240 

acagatccaa ttgcagcata tacttggcaa gcagctcgta caccgccttg acagtttgcc 6300 

ggcaacttgt caatgccctt cttagctctc accatgatag cgtctgcctt tcctacaagc 63 60 

ttcagagaca agcccaacag tctttgatca cctaggctac gggcgttgcc ttgctgtatt 6420 

tgttctgttt cttcttttct aagccattgt tgaggcagat aacatcgacc caacatcctc 6480 

gagccatact acagcataaa aggatacgtt ttctttaaca gaaatttacc cttttgttat 6540 

cagcacatac aaaaaaaaag aaatttaaga tgagtaggac ttccattctc tcaaaaattt 6600 

tattcaatcc ataaatgaat tatttttgga caaaaaagaa agattatgcc tgattttctc 6660 

tatttttttt ttttttacaa ctccaccaat actttctagc ccagcttggc gtaatcatgg 6720 

tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 6780 

ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 6840 

ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6900 

ggccaacgcg cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca 6960 

accgattgag ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca 7020 

ccgtcaccga cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta 7080 

ccattagcaa ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta 7140 
gcgacagaat caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg 7200 
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gtcatagccc ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag 7260 
ccaccaccgg aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca 7320 
ccaccctcag agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc 7380 
ccgatctagt aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat 7440 
tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct 7500 
cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa 7560 
ttatatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca 7620 
aatgtttgaa cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga 7680 
acgcagcaag atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt 7740 
gatgtggacg ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc 7800 
cgttgctgtc gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc 7860 
gaagaactcc agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac 7920 
gattccgaag cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag 7980 
gttgggcgtc gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca 8040 
agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 8100 
aagcggtcag cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg 8160 
tcctgatagc ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca 8220 
ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg 8280 
tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct 8340 
tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg 8400 
cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 8460 
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attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc 8520 

tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc 8580 

acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc 8640 

agttcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct 8700 

gacagccgga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg 8760 

aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 8820 

cgaaacgatc cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt 8880 

ggataccgag gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta 8940 

gctgatagtg accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt 9000 

agctcattaa actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca 9060 

gttccaaacg taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt 9120 

aattctccgc tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 9180 

acaggatata ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat 9240 
ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 9300 
gttccccaga tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat 9360 
ccgacagcgc gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca 9420 
gaatgccata gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca 9480 
gcaccggcat aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga 9540 
tcaggggtat gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa 9600 
cgcgcggatt ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt 9660 
gtcaagcatg acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa 9720 
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cgaggtcggc gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca 9780 
gccggcgctt tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc 9840 
catgctggcg gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt 9900 
tctgatcggg aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg 9960 
catccatgcc ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg 10020 
cttcctctgc gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag 10080 
ctacttcact gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg 10140 
cggcggcacc gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt 10200 
cgacgaagcc ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt 10260 
ggcgaaaagg aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc 10320 
aggaccgctg ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct 10380 
ccccctttcc accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc 10440 
cctagcgtcc aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc 10500 
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 10560 
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 10620 
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 10680 
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 10740 
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 10800 
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 10860 
gcgcttttcc gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc 10920 
atcctttttc gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg 10980 
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tatccaacgg cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc 11040 
cttcttcact gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg 11100 
ctggccggct accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc 11160 
aaccaggaag ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat 11220 
tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca 11280 
gggctacaaa atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa 11340 
tggcgaccbg ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac 11400 
ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga 11460 
cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta 11520 
gccgctaaaa cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca 11580 
agaagagcga cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc 11640 
gcctttgcga cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc 11700 
cctgcaaacg cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt 11760 
tgtggatacc tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact 11820 
tgaggggccg actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg 11880 
gcgacgtgga gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc 11940 
ccacagatga tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc 12000 
gcgactactg acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga 12060 
tgaggggcgc acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc 12120 
aagggtttcc gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca 12180 
atatttataa accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg 12240 
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aaggggggtg cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc 12300 
ccaggggctg cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt 12360 
ccttgccatt gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc 12420 
cggaagcatt gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag 12480 
tgagggcggc ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga 12540 
cttcatggcg gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc 12600 
cgtgctcgtg ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt 12660 
ataccgaggt atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat 12720 
ttaaaaagct accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat 12780 
attgacaata ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga 12840 
tttcaggggg caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca 12900 
taaaaacttg catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt 12960 
ctatcataat tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc 13020 
gatgactttg tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg 13080 
tgccaggtgc tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct 13140 
gattacgtgc agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca 13200 
tatcaccacg tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg 13260 
ttcaccgaat acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca 13320 
gcgctggcgc gatttagccc cgacatagcc ccactgttcg .tccatttccg cgcagacgat 13380 
gacgtcactg cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga 13440 
cgtaaaatcg tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca 13500 
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ttcatggcca tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac 13560 
tgcagttgcc atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt 13620 
ttgccgttac gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa 13680 
gccactggag cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc 13740 
cataattgtg gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac 13800 
aactttgaaa aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg 13860 
gagttcgtct tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa 13920 
ggaaataata aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat 13980 
accgctgcgt aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag 14040 
aaaatgaaaa cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg 14100 
tggaacggga aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc 14160 
tgcactttga acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc 14220 
tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg 142 80 
agtgcatcag gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag 14340 
acagccgctt agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg 14400 
aaaactggga agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga 14460 
cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct 14520 
ttgtgaaaga tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca 14580 
agtggtatga cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt 14640 
atgtcgagct attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt 14700 
atattttact ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag 14760 
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caggagcgca ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc 14820 
aagtatttgg gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac 14880 
gagaaggacg gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg 14940 
gacaccaagg caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc 15000 
ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa 15060 
gaactgatcg acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc 15120 
atgcgtgcgc cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc 15180 
aagatcgagc gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc 15240 
gtggagcgtt cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc 15300 
gacacgcgag gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa 15360 
caggtcagcg aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa 15420 
atgcagcttt ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac 15480 
gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg 15540 
caaaacaagg tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag 15600 
ctgcgggccg acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc 15660 
cctatcggcg agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg 15720 
atcaatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg 15780 
atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc 15840 
cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 15900 
gtcgtgctgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg 15960 
tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc 16020 
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aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 16080 
gagcaggtcg gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg 16140 
gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg 16200 
ggttcagcag ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact 16260 
tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag 16320 
gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc 16380 
aggatttccg cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg 16440 
tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg 16500 
tggcattcgg cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg 16560 
acggccccaa ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc 16620 
gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga 16680 
tgatcgtccg acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac 16740 
ttaatatttc gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg 16800 
tcgcggcgac ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc 16860 
taggtagccc gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg 16920 
cgctgttggt gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg 16980 
cgggggcggt ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc 17040 
ctctgctcac ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag 17100 
ctttagtgtt tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt 17160 
ggctcggcct gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac 17220 
tcgaacctac agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc 17280 
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cggggatgca tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag 17340 
caatggatag gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc 17400 
ttcctcagcg gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca 17460 
gcctgtcacg gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg 17520 
agatgatatt tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 17580 
ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc 17640 
ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggach 17700 
gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 17760 
ctggctggtg gcaggatata ttgtggtgfca aacaaattga cgcttagaca acttaataac 17820 
acattgcgga cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa 17880 
cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 17940 
ttgccccagc aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat 18000 
aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 18060 
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 18120 
ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 18180 
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 18240 
gcgagaaagg aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg 18300 
ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 18360 
tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 18420 

18449 

ggccagtgaa ttcgagctcg gtacccggg 
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<210> 50 
<211> 18617 
<212> DNA 
<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (10264) . • (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc__feature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 

<400> 50 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 
aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 
aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 
ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 
cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 
caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 
gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 
tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 
ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 



60 
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180 
240 
300 
360 
420 
480 
540 



WO 2004/063359 PCT7EP2004/000099 

291/357 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 
ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 
gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 
gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 
tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 
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ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 
tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 
tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 
tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 
attggattac tfcactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 
cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 
ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 
agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 
cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 
tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 
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attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg otgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 
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ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 492 0 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 
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ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 
cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 
ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 
agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 
cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 
tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 
ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 
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cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgchga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 
gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 
tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 
tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 
gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 
atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 
cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 
ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 
tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 
cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 
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tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 
aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 
cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 
ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 
gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 
tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 
ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 
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accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
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taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 
tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 
atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 
aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 
acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 
atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 
tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 
cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 
ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 
tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 
tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt attttatctc 11400 
tatgctgtcg aagctgcagt caatcagcgt caaggcccgc cgcgttgaac tagcccgcga 11460 
catcacgcgg cccaaagtct gcctgcatgc tcagcggtgc tcgttagttc ggctgcgagt 11520 
ggcagcacca cagacagagg aggcgctggg aaccgtgcag gctgccggcg cgggcgatga 11580 
gcacagcgcc gatgtagcac tccagcagct fcgaccgggct atcgcagagc gtcgtgcccg 11640 
gcgcaaacgg gagcagctgt cataccaggc tgccgccatt gcagcatcaa ttggcgtgtc 11700 
aggcattgcc atcttcgcca cctacctgag atttgccatg cacatgaccg tgggcggcgc 11760 
agtgccatgg ggtgaagtgg ctggcactct cctcttggtg gttggtggcg cgctcggcat 11820 
ggagatgtat gcccgctatg cacacaaagc catctggcat gagtcgcctc tgggctggct 11880 
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gctgcacaag agccaccaca cacctcgcac tggacccttt gaagccaacg acttgtttgc 11940 
aatcatcaat ggactgcccg ccatgctcct gtgtaccttt ggcttctggc tgcccaacgt 12000 
cctgggggcg gcctgctttg gagcggggct gggcatcacg ctatacggca tggcatatat 12060 
gtttgtacac gatggcctgg tgcacaggcg ctttcccacc gggcccatcg ctggcctgcc 12120 
ctacatgaag cgcctgacag tggcccacca gctacaccac agcggcaagt acggtggcgc 12180 
gccctggggt atgttcttgg gtccacagga gctgcagcac attccaggtg cggcggagga 12240 
ggtggagcga ctggtcctgg aactggactg gtccaagcgg tagaagcttg agattaaaat 12300 
agataaggaa aagaaagtga aaagaaattc ggaagcatgg cacattcttc tttttataaa 12360 
tacatgcctg actttctttt tccatcgata tgatatatgc atatgataga tatacaagca 12420 
atcttcttca aggagtttga aattttgtcc tccaggagca aaaaaaagtt tttttttata 12480 
catgtttgta cacaagaata gttaccaatt tgctttggtc ttacgtgctg caagtttata 12540 
tcgttttcaa tttctttgtc tttacatttt ctttgtcctt tatctttcct catttagtct 12600 
ttgggagaat taggaaaagg gagcggaaag gtaagaaatg cttgcgtatt ttactaattc 12660 
ggcaaacatc caatttggca aacagcagcc tgtgcaacgc tctcgagatg acagtatctt 12720 
tgattacact ctaaatctcg atgacccgac caaaaagagc gaacaaagaa ataatcttgt 12780 
gcattcgaat atgatggaag attttttccc ccttattcta aatgttgaca tagcgtgtat 12840 
gttatataaa caaaaagaaa ttgtacaaac tttcttttct tctcttttta ttttatctct 12900 
atgatccagt tagaacaacc actcagtcat caagcaaaac tgactccagt actgagaagt 12960 
aaatctcagt ttaaggggct tttcattgct attgtcattg ttagcgcatg ggtcattagc 13020 
ctgagtttat tactttccct tgacatctca aagctaaaat tttggatgtt attgcctgtt 13080 
atactatggc aaacattttt atatacggga ttatttatta catctcatga tgccatgcat 13140 
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ggcgtagtat ttccccaaaa caccaagatt aatcatttga ttggaacatt gaccctatcc 13200 
ctttatggtc ttttaccata tcaaaaacta ttgaaaaaac attggttaca ccaccacaat 13260 
ccagcaagct caatagaccc ggattttcac aatggtaaac accaaagttt ctttgcttgg 13320 
tattttcatt ttatgaaagg ttactggagt tgggggcaaa taattgcgtt gactattatt 13380 
tataactttg ctaaatacat actccatatc ccaagtgata atctaactta cttttgggtg 13440 
ctaccctcgc ttttaagttc attacaatta ttctattttg gtactttttt accccatagt 13500 
gaaccaatag ggggttatgt tcagcctcat tgtgcccaaa caattagccg tcctatttgg 13560 
tggtcattta tcacgtgcta tcattttggc taccacgagg aacatcacga atatcctcat 13620 
atttcttggt ggcagttacc agaaatttac aaagcaaaat agaagcttgg cgtaatcatg 13680 
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 13740 
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 13800 
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 13860 
cggccaacgc gcggggagag gcggtttgcg tattgggcca aagacaaaag ggcgacattc 13920 
aaccgattga gggagggaag gtaaatattg acggaaatta ttcattaaag gtgaattatc 13980 
accgtcaccg acttgagcca tttgggaatt agagccagca aaatcaccag tagcaccatt 14040 
accattagca aggccggaaa cgtcaccaat gaaaccatcg atagcagcac cgtaatcagt 14100 
agcgacagaa tcaagtttgc ctttagcgtc agactgtagc gcgttttcat cggcattttc 14160 
ggtcatagcc cccttattag cgtttgccat cttttcataa tcaaaatcac cggaaccaga 14220 
gccaccaccg gaaccgcctc cctcagagcc gccaccctca gaaccgccac cctcagagcc 14280 
accaccctca gagccgccac cagaaccacc accagagccg ccgccagcat tgacaggagg 14340 
cccgatctag taacatagat gacaccgcgc gcgataattt atcctagttt gcgcgctata 14400 
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ttttgttttc tatcgcgtat taaatgtata attgcgggac tctaatcata aaaacccatc 14460 
tcataaataa cgtcatgcat tacatgttaa ttattacatg cttaacgtaa ttcaacagaa 14520 
attatatgat aatcatcgca agaccggcaa caggattcaa tcttaagaaa ctttattgcc 14580 
aaatgtttga acgatcgggg atcatccggg tctgtggcgg gaactccacg aaaatatccg 14640 
aacgcagcaa gatatcgcgg tgcatctcgg tcttgcctgg gcagtcgccg ccgacgccgt 14700 
tgatgtggac gccgggcccg atcatattgt cgctcaggat cgtggcgttg tgcttgtcgg 14760 
ccgttgctgt cgtaatgata tcggcacctt cgaccgcctg ttccgcagag atcccgtggg 14820 
cgaagaactc cagcatgaga tccccgcgct ggaggatcat ccagccggcg tcccggaaaa 14880 
cgattccgaa gcccaacctt tcatagaagg cggcggtgga atcgaaatct cgtgatggca 14940 
ggttgggcgt cgcttggtcg gtcatttcga accccagagt cccgctcaga agaactcgtc 15000 
aagaaggcga tagaaggcga tgcgctgcga atcgggagcg gcgataccgt aaagcacgag 15060 
gaagcggtca gcccattcgc cgccaagctc ttcagcaata tcacgggtag ccaacgctat 15120 
gtcctgatag cggtccgcca cacccagccg gccacagtcg atgaatccag aaaagcggcc 15180 
attttccacc atgatattcg gcaagcaggc atcgccatgg gtcacgacga gatcatcgcc 15240 
gtcgggcatg cgcgccttga gcctggcgaa cagttcggct ggcgcgagcc cctgatgctc 15300 
ttcgtccaga tcatcctgat cgacaagacc ggcttccatc cgagtacgtg ctcgctcgat 15360 
gcgatgtttc gcttggtggt cgaatgggca ggtagccgga tcaagcgtat gcagccgccg 15420 
cattgcatca gccatgatgg atactttctc ggcaggagca aggtgagatg acaggagatc 15480 
ctgccccggc acttcgccca atagcagcca gtcccttccc gcttcagtga caacgtcgag 15540 
cacagctgcg caaggaacgc ccgtcgtggc cagccacgat agccgcgctg cctcgtcctg 15600 
cagttcattc agggcaccgg acaggtcggt cttgacaaaa agaaccgggc gcccctgcgc 15660 
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tgacagccgg aacacggcgg catcagagca gccgattgtc tgttgtgccc agtcatagcc 15720 
gaatagcctc tccacccaag cggccggaga acctgcgtgc aatccatctt gttcaatcat 15780 
gcgaaacgat ccagatccgg tgcagattat ttggattgag agtgaatatg agactctaat 15840 
tggataccga ggggaattta tggaacgtca gtggagcatt tttgacaaga aatatttgct 15900 
agctgatagt gaccttaggc gacttttgaa cgcgcaataa tggtttctga cgtatgtgct 15960 
tagctcatta aactccagaa acccgcggct gagtggctcc ttcaacgttg cggttctgtc 16020 
agttccaaac gtaaaacggc ttgtcccgcg tcatcggcgg gggtcataac gtgactccct 16080 
taattctccg ctcatgatca gattgtcgtt tcccgccttc agtttaaact atcagtgttt 16140 
gacaggatat attggcgggt aaacctaaga gaaaagagcg tttattagaa taatcggata 16200 
tttaaaaggg cgtgaaaagg tttatccgtt cgtccatttg tatgtgcatg ccaaccacag 16260 
ggttccccag atctggcgcc ggccagcgag acgagcaaga ttggccgccg cccgaaacga 16320 
tccgacagcg cgcccagcac aggtgcgcag gcaaattgca ccaacgcata cagcgccagc 16380 
agaatgccat agtgggcggt gacgtcgttc gagtgaacca gatcgcgcag gaggcccggc 16440 
agcaccggca taatcaggcc gatgccgaca gcgtcgagcg cgacagtgct cagaattacg 16500 
atcaggggta tgttgggttt cacgtctggc ctccggacca gcctccgctg gtccgattga 16560 
acgcgcggat tctttatcac tgataagttg gtggacatat tatgtttatc agtgataaag 16620 
tgtcaagcat gacaaagttg cagccgaata cagtgatccg tgccgccctg gacctgttga 16680 
acgaggtcgg cgtagacggt ctgacgacac gcaaactggc ggaacggttg ggggttcagc 16740 
agccggcgct ttactggcac ttcaggaaca agcgggcgct gctcgacgca ctggccgaag 16800 
ccatgctggc ggagaatcat acgcattcgg tgccgagagc cgacgacgac tggcgctcat 16860 
ttctgatcgg gaatgcccgc agcttcaggc aggcgctgct cgcctaccgc gatggcgcgc 16920 
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gcatccatgc cggcacgcga ccgggcgcac ogcagatgga aacggccgac gcgcagcttc 16980 
gcttcctctg cgaggcgggt ttttcggccg gggacgccgt caatgcgctg atgacaatca 17040 
gctacttcac tgttggggcc gtgcttgagg agcaggccgg cgacagcgat gccggcgagc 17100 
gcggcggcac cgttgaacag gctccgctct cgccgctgtt gcgggccgcg atagacgcct 17160 
tcgacgaagc cggtccggac gcagcgttcg agcagggact cgcggtgatt gtcgatggat 17220 
tggcgaaaag gaggctcgtt gtcaggaacg ttgaaggacc gagaaagggt gacgattgat 17280 
caggaccgct gccggagcgc aacccactca ctacagcaga gccatgtaga caacatcccc 17340 
tccccctttc caccgcgtca gacgcccgta gcagcccgct acgggctttt tcatgccctg 17400 
ccctagcgtc caagcctcac ggccgcgctc ggcctctctg gcggccttct ggcgctcttc 17460 
cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 17520 
tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 17580 
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 17640 
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 17700 
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 17760 
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 17820 
ggcgcttttc cgctgcataa ccctgcttcg gggtcattat agcgattttt tcggtatatc 17880 
catccttttt cgcacgatat acaggatttt gccaaagggt tcgtgtagac tttccttggt 17940 
gtatccaacg gcgtcagccg ggcaggatag gtgaagtagg cccacccgcg agcgggtgtt 18000 
ccttcttcac tgtcccttat tcgcacctgg cggtgctcaa cgggaatcct gctctgcgag 18060 
gctggccggc taccgccggc gtaacagatg agggcaagcg gatggctgat gaaaccaagc 18120 
caaccaggaa gggcagccca cctatcaagg tgtactgcct tccagacgaa cgaagagcga 18180 
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ttgaggaaaa ggcggcggcg gccggcatga gcctgtcggc ctacctgctg gccgtcggcc 18240 

agggctacaa aatcacgggc gtcgtggact atgagcacgt ccgcgagctg gcccgcatca 18300 

atggcgacct gggccgcctg ggcggcctgc tgaaactctg gctcaccgac gacccgcgca 18360 

cggcgcggtt cggtgatgcc acgatcctcg ccctgctggc gaagatcgaa gagaagcagg 18420 

acgagcttgg caaggtcatg atgggcgtgg tccgcccgag ggcagagcca tgactttttt 18480 

agccgctaaa acggccgggg gghgcgcgtg attgccaagc acgtccccat gcgctccatc 18540 

aagaagagcg acttcgcgga gctggtgaag tacatcaccg acgagcaagg caagaccgag 18600 
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<40O 51 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa' aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgc'gataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 
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ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatahcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc" 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 
aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 
ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 
aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 
taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 
tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 
tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 
catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 
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tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 33 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 33 
gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 
ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 
aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 
gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 
tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 
agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 
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tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 
ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 
tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 
acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 
tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 
acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 
accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 42 
gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 42 
gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 
ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 
gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 
cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 
tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 
ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 
gctcgggacg cacggcgcgc tctacgaact " gccgataaac agaggattaa aattgacaat 4680 
tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 
ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 
gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 
catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 
tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 
cggtatgct g ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 
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tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 
agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 
ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 
cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 
tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 
cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 
caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 59 
gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 
taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 
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aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 
gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 
gtacaccaa'c gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 
aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 
aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 
aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 
cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 
tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 
tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 
tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440. 
tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 
gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 
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tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 
cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 
agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 
gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 
atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 
gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 
ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 
cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 
tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 
aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 
cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 
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tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
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ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcacdag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgqaggc atgcaagctt gagattaaaa 10800 
tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 
atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 
aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 
acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 
atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 
tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 
cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 
ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 
tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 
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tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt attttatctc 11400 
tat gttgtgg atttggaatg ccctgatcgt tttcgttacc gtgattggca tggaagtgat 11460 
tgctgcactg gcacacaaat acatcatgca cggctggggt tggggatggc atctttcaca 11520 
tcatgaaccg cgtaaaggtg cgtttgaagt taacgatctt tatgccgtgg tttttgctgc 11580 
attatcgatc ctgctgattt atctgggcag tacaggaatg tggccgctcc agtggattgg 11640 
cgcaggtatg acggcgtatg gattactcta ttttatggtg cacgacgggc tggtgcatca 11700 
acgttggcca ttccgctata ttccacgcaa gggctacctc aaacggttgt atatggcgca 11760 
ccgtatgcat cacgccgtca ggggcaaaga aggttgtgtt tcttttggct tcctctatgc 11820 
gccgcccctg tcaaaacttc aggcgacgct ccgggaaaga catggcgcta gagcgggcgc 11880 
tgccagagat gcgcagggcg gggaggatga gcccgcatcc gggaagtaag ggcctgacca 11940 
gaggcggcca gcagcagcgt taatttttcg ggcgtggtcg ttgactgccg ctgatcccaa 12000 
agcttgagat taaaatagat aaggaaaaga aagtgaaaag aaattcggaa gcatggcaca 12060 
ttcttctttt tataaataca tgcctgactt tctttttcca tcgatatgat atatgcatat 12120 
gatagatata caagcaatct tcttcaagga gtttgaaatt ttgtcctcca ggagcaaaaa 12180 
aaagtttttt tttatacatg tttgtacaca agaatagtta ccaatttgct ttggtcttac 12240 
gtgctgcaag tttatatcgt tttcaatttc tttgtcttta cattttcttt gtcctttatc 12300 
tttcctcatt tagtctttgg gagaattagg aaaagggagc ggaaaggtaa gaaatgcttg 12360 
cgtattttac taattcggca aacatccaat ttggcaaaca gcagcctgtg caacgctctc 12420 
gagatgacag tatctttgat tacactctaa atctcgatga cccgaccaaa aagagcgaac 12480 
aaagaaataa tcttgtgcat tcgaatatga tggaagattt tttccccctt attctaaatg 12540 
ttgacatagc gtgtatgtta tataaacaaa aagaaattgt acaaactttc ttttcttctc 12600 



WO 2004/063359 PCT7EP2004/000099 

316/357 

tttttatttt atctctatga tccagttaga acaaccactc agtcatcaag caaaactgac 12660 
tccagtactg agaagtaaat ctcagtttaa ggggcttttc attgctattg tcattgttag 12720 
cgcatgggtc attagcctga gtttattact ttcccttgac atctcaaagc taaaattttg 12780 
gatgttattg cctgttatac tatggcaaac atttttatat acgggattat ttattacatc 12840 
tcatgatgcc atgcatggcg tagtatttcc ccaaaacacc aagattaatc atttgattgg 12900 
aacattgacc ctatcccttt atggtctttt accatatcaa aaactattga aaaaacattg 12960 
gttacaccac cacaatccag caagctcaat agacccggat tttcacaatg gtaaacacca 13020 
aagtttcttt gcttggtatt ttcattttat gaaaggttac tggagttggg ggcaaataat 13080 
tgcgttgact attatttata actttgctaa atacatactc catatcccaa gtgataatct 13140 
aacttacttt tgggtgctac cctcgctttt aagttcatta caattattct attttggtac 13200 
ttttttaccc catagtgaac caataggggg ttatgttcag cctcattgtg cccaaacaat 13260 
tagccgtcct atttggtggt catttatcac gtgctatcat tttggctacc acgaggaaca 13320 
tcacgaatat cctcatattt cttggtggca gttaccagaa atttacaaag caaaatagaa 13380 
gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 13440 
cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 13500 
aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 13560 
agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggccaaaga 13620 
caaaagggcg acattcaacc gattgaggga gggaaggtaa atattgacgg aaattattca 13680 
ttaaaggtga attatcaccg tcaccgactt gagccatttg ggaattagag ccagcaaaat 13740 
caccagtagc accattacca ttagcaaggc cggaaacgtc accaatgaaa ccatcgatag 13800 
cagcaccgta atcagtagcg acagaatcaa gtttgccttt agcgtcagac tgtagcgcgt 13860 
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tttcatcggc attttcggtc atagccccct tattagcgtt tgccatcttt tcataatcaa 13920 
aatcaccgga accagagcca ccaccggaac cgcctccctc agagccgcca ccctcagaac 13980 
cgccaccctc agagccacca ccctcagagc cgccaccaga accaccacca gagccgccgc 14040 
cagcattgac aggaggcccg atctagtaac atagatgaca ccgcgcgcga taatttatcc 14100 
tagtttgcgc gctatatttt gttttctatc gcgtattaaa tgtataattg cgggactcta 14160 
atcataaaaa cccatctcat aaataacgtc atgcattaca tgttaattat tacatgctta 14220 
acgtaattca acagaaatta tatgataatc atcgcaagac cggcaacagg attcaatctt 14280 
aagaaacttt attgccaaat gtttgaacga tcggggatca tccgggtctg tggcgggaac 14340 
tccacgaaaa tatccgaacg cagcaagata tcgcggtgca tctcggtctt gcctgggcag 14400 
tcgccgccga cgccgttgat gtggacgccg ggcccgatca tattgtcgct caggatcgtg 14460 
gcgttgtgct tgtcggccgt tgctgtcgta atgatatcgg caccttcgac cgccfcgttcc 14520 
gcagagatcc cgtgggcgaa gaactccagc atgagatccc cgcgctggag gatcatccag 14580 
ccggcgtccc ggaaaacgat tccgaagccc aacctttcat agaaggcggc ggtggaatcg 14640 
aaatctcgtg atggcaggtt gggcgtcgct tggtcggtca tttcgaaccc cagagtcccg 147 00 
ctcagaagaa ctcgtcaaga aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga 147 60 
taccgtaaag cacgaggaag cggtcagccc attcgccgcc aagctcttca gcaatatcac 14820 
gggtagccaa cgctatgtcc tgatagcggt ccgccacacc cagccggcca cagtcgatga 14880 
atccagaaaa gcggccattt tccaccatga tattcggcaa gcaggcatcg ccatgggtca 14940 
cgacgagatc atcgccgtcg ggcatgcgcg ccttgagcct ggcgaacagt tcggctggcg 15000 
cgagcccctg atgctcttcg tccagatcat cctgatcgac aagaccggct tccatccgag 15060 
tacgtgctcg ctcgatgcga tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa 15120 
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gcgtatgcag ccgccgcatt gcatcagcca tgatggatac tttctcggca ggagcaaggt 15180 
gagatgacag gagatcctgc cccggcactt cgcccaatag cagccagtcc cttcccgctt 15240 
cagtgacaac gtcgagcaca gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc 15300 
gcgctgcctc gtcctgcagt tcattcaggg caccggacag gtcggtcttg acaaaaagaa 15360 
ccgggcgccc ctgcgctgac agccggaaca cggcggcatc agagcagccg attgtctgtt 15420 
gtgcccagtc atagccgaat agcctctcca cccaagcggc cggagaacct gcgtgcaatc 15480 
catcttgttc aatcatgcga aacgatccag atccggtgca gattatttgg attgagagtg 15540 
aatatgagac tctaattgga taccgagggg aatttatgga acgtcagtgg agcatttttg 15600 
acaagaaata tttgctagct gatagtgacc ttaggcgact tttgaacgcg caataatggt 15660 
ttctgacgta tgtgcttagc tcattaaact ccagaaaccc gcggctgagt ggctccttca 15720 
acgttgcggt tctgtcagtt ccaaacgtaa aacggcttgt cccgcgtcat cggcgggggt 15780 
cataacgtga ctcccttaat tctccgctca tgatcagatt gtcgtttccc gccttcagtt 15840 
taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa agagcgttta 15900 
ttagaataat cggatattta aaagggcgtg aaaaggttta tccgttcgtc catttgtatg 15960 
tgcatgccaa ccacagggtt ccccagatct ggcgccggcc agcgagacga gcaagattgg 16020 
ccgccgcccg aaacgatccg acagcgcgcc cagcacaggt gcgcaggcaa attgcaccaa 16080 
cgcatacagc gccagcagaa tgccatagtg ggcggtgacg tcgttcgagt gaaccagatc 16140 
gcgcaggagg cccggcagca ccggcataat caggccgatg ccgacagcgt cgagcgcgac 16200 
agtgctcaga attacgatca ggggtatgtt gggtttcacg tctggcctcc ggaccagcct 16260 
ccgctggtcc gattgaacgc gcggattctt tatcactgat aagttggtgg acatattatg 16320 
tttatcagtg ataaagtgtc aagcatgaca aagttgcagc cgaatacagt gatccgtgcc 16380 
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gccctggacc tgttgaacga ggtcggcgta gacggtctga cgacacgcaa actggcggaa 16440 
cggttggggg ttcagcagcc ggcgctttac tggcacttca ggaacaagcg ggcgctgctc 16500 
gacgcactgg ccgaagccat gctggcggag aatcatacgc attcggtgcc gagagccgac 16560 
gacgactggc gctcatttct gatcgggaat gcccgcagct tcaggcaggc gctgctcgcc 16620 
taccgcgatg gcgcgcgcat ccatgccggc acgcgaccgg gcgcaccgca gatggaaacg 16680 
gccgacgcgc agcttcgctt cctctgcgag gcgggttttt cggccgggga cgccgtcaat 16740 
gcgctgatga caatcagcta cttcactgtt ggggccgtgc ttgaggagca ggccggcgac 16800 
agcgatgccg gcgagcgcgg cggcaccgtt gaacaggctc cgctctcgcc gctgttgcgg 16860 
gccgcgatag acgccttcga cgaagccggt ccggacgcag cgttcgagca gggactcgcg 16920 
gtgattgtcg atggattggc gaaaaggagg ctcgttgtca ggaacgttga aggaccgaga 16980 
aagggtgacg attgatcagg accgctgccg gagcgcaacc cactcactac agcagagcca 17040 
tgtagacaac atcccctccc cctttccacc gcgtcagacg cccgtagcag cccgctacgg 17100 
gctttttcat gccctgccct agcgtccaag cctcacggcc gcgctcggcc tctctggcgg 17160 
ccttctggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 17220 
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 17280 
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 17340 
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 17400 
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 17460 
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 17520 
tcccttcggg aagcgtggcg cttttccgct gcataaccct gcttcggggt cattatagcg 17580 
attttttcgg tatatccatc ctttttcgca cgatatacag gattttgcca aagggttcgt 17640 
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gtagactttc cttggtgtat ccaacggcgt cagccgggca ggataggtga agtaggccca 17700 

cccgcgagcg ggtgttcctt cttcactgtc ccttattcgc acctggcggt gctcaacggg 17760 

aatcctgctc tgcgaggctg gccggctacc gccggcgtaa cagatgaggg caagcggatg 17820 

gctgatgaaa ccaagccaac caggaagggc agcccaccta tcaaggtgta ctgccttcca 17880 

gacgaacgaa gagcgattga ggaaaaggcg gcggcggccg gcatgagcct gtcggcctac 17940 

ctgctggccg tcggccaggg ctacaaaatc acgggcgtcg tggactatga gcacgtccgc 18000 

gagctggccc gcatcaatgg cgacctgggc cgcctgggcg gcctgctgaa actctggctc 18060 

accgacgacc cgcgcacggc gcggttcggt gatgccacga tcctcgccct gctggcgaag 18120 

atcgaagaga agcaggacga gcttggcaag gtcatgatgg gcgtggtccg cccgagggca 18180 

gagccatgac ttttttagcc gctaaaacgg ccggggggtg cgcgtgattg ccaagcacgt 18240 

ccccatgcgc tccatcaaga agagcgactt cgcggagctg gtgaagtaca tcaccgacga 18300 

gcaaggcaag accgagcgcc tttgcgacgc tea 18333 
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60 



cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 
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aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 
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tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 
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gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 - 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 
cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 
ctccacatct ccactcgacc tgcaggcatg caagcttgag tctatcgcct ccaaaaagta 4020 
cggtgctgaa ttcagatatc aatcgcctgt tgctaaaatt aacactgtcg ataaagacaa 4080 
gcgtgtaacc ggtgtcactt tggaaagcgg agaagtcatt gaagccgatg cagtcgtatg 4140 
taatgcggat cttgtttatg cttatcacca tctgttacct ccttgcaatt ggacaaagaa 4200 
gacattagcc tcaaagaaac tcacttcatc atctatttcg ttttattggt ccatgtcaac 4260 
aaaggtgcct caattagacg tacacaatat cttcttggct gaagcctaca aggaaagttt 4320 
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tgatgagatt ttcaacgact tcggtttgcc ctctgaagct tggcgtaatc atggtcatag 4380 

ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 4440 

ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 4500 

tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 4560 

cgcgcgggga gaggcggttt gcgtattggg ccaaagacaa aagggcgaca ttcaaccgat 4620 

tgagggaggg aaggtaaata ttgacggaaa ttattcatta aaggtgaatt atcaccgtca 4680 

ccgacttgag ccatttggga attagagcca gcaaaatcac cagtagcacc attaccatta 4740 

gcaaggccgg aaacgtcacc aatgaaacca tcgatagcag caccgtaatc agtagcgaca 4800 

gaatcaagtt tgcctttagc gtcagactgt agcgcgtttt catcggcatt ttcggtcata 4860 

gcccccttat tagcgtttgc catcttttca taatcaaaat caccggaacc agagccacca 4920 

ccggaaccgc ctccctcaga gccgccaccc tcagaaccgc caccctcaga gccaccaccc 4980 

tcagagccgc caccagaacc accaccagag ccgccgccag cattgacagg aggcccgatc 5040 

tagtaacata gatgacaccg cgcgcgataa tttatcctag tttgcgcgct atattttgtt 5100 

ttctatcgcg tattaaatgt ataattgcgg gactctaatc ataaaaaccc atctcataaa 5160 

taacgtcatg cattacatgt taattattac atgcttaacg taattcaaca gaaattatat 5220 
gataatcatc gcaagaccgg caacaggatt caatcttaag aaactttatt gccaaatgtt 5280 
tgaacgatcg gggatcatcc gggtctgtgg cgggaactcc acgaaaatat ccgaacgcag 5340 
caagatatcg cggtgcatct cggtcttgcc tgggcagtcg ccgccgacgc cgttgatgtg 5400 
gacgccgggc ccgatcatat tgtcgctcag gatcgtggcg ttgtgcttgt cggccgttgc 5460 
tgtcgtaatg atatcggcac cttcgaccgc ctgttccgca gagatcccgt gggcgaagaa 5520 
ctccagcatg agatccccgc gctggaggat catccagccg gcgtcccgga aaacgattcc 5580 
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gaagcccaac ctttcataga aggcggcggt ggaatcgaaa tctcgtgatg gcaggttggg 5640 

cgtcgcttgg tcggtcattt cgaaccccag agtcccgctc agaagaactc gtcaagaagg 5700 

cgatagaagg cgatgcgctg cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg 5760 

tcagcccatt cgccgccaag ctcttcagca atatcacggg tagccaacgc tatgtcctga 5820 

tagcggtccg ccacacccag ccggccacag tcgatgaatc cagaaaagcg gccattttcc 5880 

accatgatat tcggcaagca ggcatcgcca tgggtcacga cgagatcatc gccgtcgggc 5940 

atgcgcgcct tgagcctggc gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc 6000 

agatcatcct gatcgacaag accggcttcc atccgagtac gtgctcgctc gatgcgatgt 6060 

ttcgcttggt ggtcgaatgg gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca 6120 

tcagccatga tggatacttt ctcggcagga gcaaggtgag atgacaggag atcctgcccc 6180 

ggcacttcgc ccaatagcag ccagtccctt cccgcttcag tgacaacgtc gagcacagct 6240 

gcgcaaggaa cgcccgtcgt ggccagccac gatagccgcg ctgcctcgtc ctgcagttca 6300 

ttcagggcac cggacaggtc ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc 6360 

cggaacacgg cggcatcaga gcagccgatt gtctgttgtg cccagtcata gccgaatagc 6420 

ctctccaccc aagcggccgg agaacctgcg tgcaatccat cttgttcaat catgcgaaac , 6480 

gatccagatc cggtgcagat tatttggatt gagagtgaat atgagactct aattggatac 6540 
cgaggggaat ttatggaacg tcagtggagc atttttgaca agaaatattt gctagctgat 6600 
agtgacctta ggcgactttt gaacgcgcaa taatggtttc tgacgtatgt gcttagctca 6660 
ttaaactcca gaaacccgcg gctgagtggc tccttcaacg ttgcggttct gtcagttcca 6720 
aacgtaaaac ggcttgtccc gcgtcatcgg cgggggtcat aacgtgactc ccttaattct 6780 
ccgctcatga tcagattgtc gtttcccgcc ttcagtttaa actatcagtg tttgacagga 6840 
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tatattggcg ggtaaaccta agagaaaaga gcgtttatta gaataatcgg atatttaaaa 6900 

gggcgtgaaa aggtttatcc gttcgtccat ttgtatgtgc atgccaacca cagggttccc 6960 

cagatctggc gccggccagc gagacgagca agattggccg ccgcccgaaa cgatccgaca 7020 

gcgcgcccag cacaggtgcg caggcaaatt gcaccaacgc atacagcgcc agcagaatgc 7080 

catagtgggc ggtgacgtcg ttcgagtgaa ccagatcgcg caggaggccc ggcagcaccg 7140 

gcataatcag gccgatgccg acagcgtcga gcgcgacagt gctcagaatt acgatcaggg 7200 

gtatgttggg tttcacgtct ggcctccgga ccagcctccg ctggtccgat tgaacgcgcg 7260 

gattctttat cactgataag ttggtggaca tattatgttt atcagtgata aagtgtcaag 7320 

catgacaaag ttgcagccga atacagtgat ccgtgccgcc ctggacctgt tgaacgaggt 7380 

cggcgtagac ggtctgacga cacgcaaact ggcggaacgg ttgggggttc agcagccggc 7440 

gctttactgg cacttcagga acaagcgggc gctgctcgac gcactggccg aagccatgct 7500 

ggcggagaat catacgcatt cggtgccgag agccgacgac gactggcgct catttctgat 7560 

cgggaatgcc cgcagcttca ggcaggcgct gctcgcctac cgcgatggcg cgcgcatcca 7620 

tgccggcacg cgaccgggcg caccgcagat ggaaacggcc gacgcgcagc ttcgcttcct 7680 

ctgcgaggcg ggtttttcgg ccggggacgc cgtcaatgcg ctgatgacaa tcagctactt 7740 
cactgttggg gccgtgcttg aggagcaggc cggcgacagc gatgccggcg agcgcggcgg 7800 
caccgttgaa caggctccgc tctcgccgct gttgcgggcc gcgatagacg ccttcgacga 7860 
agccggtccg gacgcagcgt tcgagcaggg actcgcggtg attgtcgatg gattggcgaa 7920 
aaggaggctc gttgtcagga acgttgaagg accgagaaag ggtgacgatt gatcaggacc 7980 
gctgccggag cgcaacccac tcactacagc agagccatgt agacaacatc ccctccccct 8040 
ttccaccgcg tcagacgccc gtagcagccc gctacgggct ttttcatgcc ctgccctagc 8100 
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gtccaagcct cacggccgcg ctcggcctct ctggcggcct tctggcgctc ttccgcttcc 8160 

tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 8220 

aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 8280 

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 8340 

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 8400 

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 8460 

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 8520 

ttccgctgca taaccctgct tcggggtcat tatagcgatt ttttcggtat atccatcctt 8580 

tttcgcacga tatacaggat tttgccaaag ggttcgtgta gactttcctt ggtgtatcca 8640 

acggcgtcag ccgggcagga taggtgaagt aggcccaccc gcgagcgggt gttccttctt 8700 

cactgtccct tattcgcacc tggcggtgct caacgggaat cctgctctgc gaggctggcc 8760 

ggctaccgcc ggcgtaacag atgagggcaa gcggatggct gatgaaacca agccaaccag 8820 

gaagggcagc ccacctatca aggtgtactg ccttccagac gaacgaagag cgattgagga 8880 

aaaggcggcg gcggccggca tgagcctgtc ggcctacctg ctggccgtcg gccagggcta 8940 

caaaatcacg ggcgtcgtgg actatgagca cgtccgcgag ctggcccgca tcaatggcga 9000 

cctgggccgc ctgggcggcc tgctgaaact ctggctcacc gacgacccgc gcacggcgcg 9060 

gttcggtgat gccacgatcc tcgccctgct ggcgaagatc gaagagaagc aggacgagct 9120 

tggcaaggtc atgatgggcg tggtccgccc gagggcagag ccatgacttt tttagccgct 9180 

aaaacggccg gggggtgcgc gtgattgcca agcacgtccc catgcgctcc atcaagaaga 9240 

gcgacttcgc ggagctggtg aagtacatca ccgacgagca aggcaagacc gagcgccttt 9300 

gcgacgctca ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca 9360 
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aacgcgccag aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga 9420 

tacctcgcgg aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg 9480 

gccgactcac ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg 9540 

tggagctggc cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag 9600 

atgatgtgga caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact 9660 

actgacagat gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg 9720 

gcgcacctat tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt 9780 

ttccgcccgt ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt 9840 

ataaaccttg tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg 9900 

ggtgcccccc cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg 9960 

gctgcgcccc tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc 10020 

cattgccggg atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag 10080 

cattgacgtg ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg 10140 

cggcggcctg ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat 10200 

ggcggggccg gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct 10260 

cgtgttcggg ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg 1032 0 

aggtatgaaa acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa 10380 

agctaccaag acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac 10440 

aatactgata agataatata tcttttatat agaagatatc gccgtatgta aggatttcag 10500 

ggggcaaggc ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa 10560 

cttgcatgga ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca 10620 
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taattgggta atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac 10680 
tttgtcatgc agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag 10740 
gtgctgcctc agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac 10800 
gtgcagcttt cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac 10860 
cacgtcaaag ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc 10920 
gaatacgtgc gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg 10980 
gcgcgattta gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc 11040 
actgcccggc tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa 11100 
atcgtgttga ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg 11160 
gccatatcaa tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt 11220 
tgccatgttt tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg 11280 
ttacgcacca ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact 11340 
ggagcacctc aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat 11400 
tgtggtttca aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt 11460 
gaaaaagctg ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc 11520 
gtcttgttat aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat 11580 
aataaatggc taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct 11640 
gcgtaaaaga tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg 11700 
aaaacctata tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac 11760 
gggaaaagga catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact 11820 
ttgaacggca tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct 11880 
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cggaagagta tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca 11940 
tcaggctctt tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc 12000 
gcttagccga attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact 12060 
gggaagaaga cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa 12120 
agcccgaaga ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga 12180 
aagatggcaa agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt 12240 
atgacattgc cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg 12300 
agctattttt tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt 12360 
tactggatga attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag 12420 
cgcaccgact tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat 12480 
ttgggcaagg ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag 12540 
gacggccaga cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc 12600 
aaggcaccag gcgggtcaaa tcaggaataa gggcaca'ttg ccccggcgtg agtcggggca 12660 
atcccgcaag gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg 12720 
atcgacgcgg ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt 12780 
gcgccccgcg aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc 12840 
gagcgcgaca gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag 12900 
cgttcgcgtc gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg 12960 
cgaggaacta tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc 13020 
agcgaggcca agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag 13080 
ctttccttgt tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg 13140 
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gcccgctctg ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac 13200 

aaggtcattt tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg 13260 

gccgacgatg acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc 13320 

ggcgagccga tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat 13380 

ggccggtatt acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc 13440 

ttcacgtccg accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc 13500 

ctggaccgtg gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg 13560 

ctgtttgctg gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg 13620 

acggcccgac ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg 13680 

gaaaccttcc gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag 13740 

gtcggcgaag cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat 13800 

gatgacctgg tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca 13860 

gcagccagcg ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc 13920 

gctcagtatc gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa 13980 

aattgacaat tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt 14040 

tccgcgagat ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg 14100 

agcacgagga gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat 14160 
tcggcgccta catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc 14220 
ccaaggacgc tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc 14280 
gaggggtcgc cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg 14340 
tccgacagat tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata 14400 
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tttcgctatt ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg 14460 
cgacggtagg cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta 14520 
gcccgatacg attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt 14580 
tggtgttgac accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg 14640 
cggtttccat ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc 14700 
tcacctttac cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag 14760 
tgtttgatcc gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg 14820 
gcctgatcgg agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac 14880 
ctacagttgt ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga 14940 
tgcatcaggc cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg 15000 
ataggggagt tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc 15060 
agcggcttta tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt 15120 
cacggttaag cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga 15180 
tatttgatca caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga 15240 
gatcatccgt gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac 15300 
atgagcaaag tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg 15360 
ctgcctgtat cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct 15420 
ggtggcagga tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg 15480 
cggacgtttt taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg 15540 
attgcccttc accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc 15600 
cagcaggcga aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca 15660 
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aaagaatagc ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta 15720 
aagaacgtgg actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta 15780 
cgtgaaccat cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg 15840 
aaccctaaag ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga 15900 
aaggaaggga agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg 
gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag 
gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag 
tgaattcgag ctcggtaccc ggg 

<210> 63 
<211> 25 
<212> - DNA 
<213> Artificial 

<220> 

<223> Primer 
<400> 63 

ggcgtacttg aaggaaccct taccg 

<210> 64 

<211> 25 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



15960 
16020 
16080 
16103 



<400> 64 

attgatgctc ccggtcaccg tgatt 



25 
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<210> 65 
<211> 500 
<212> DNA 

<213> Blakeslea trispora 
<400> 65 

aatctataca atgctccata gactcacatt gatattgtcg aagatttcga tgctgactta 60 
gtagagcaac tacaaaagtt agcagagaag catgatttct taatctttga agaccgcaag 120 
tttgcagata tcggtatgtg aattctatct attttttttc tgatgtgtgc atggatgact 180 
catgatcata ttcttaggta atactgtcaa gcatcaatat ggcaagggcg tttacaagat 240 
tgcttcttgg tctcatatta ctaatgctca cacagttcct ggagaaggta ttatcaaggg 300 
acttgccgaa gtcggcctcc ctcttggtcg tggcttgctt ttgctagcag aaatgtcatc 360 
tcaaggtgca ttaactaagg gtatttacac tgccgaatct gtcaatatgg ctcgccgcaa 420 
caaagatttc gtttttggct ttattgcaca acacaaaatg aatcagtacg atgatgagga 480 
ttttgttgtc atgtcgcctg 500 

<210> 66 
<211> 611 
<212> DNA 

<213> Blakeslea trispora 
<400> 66 

gagattaaaa tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt 60 
ctttttataa atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag 120 
atatacaagc aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt 180 
ttttttttat acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct 240 
gcaagtttat atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc 300 
tcatttagtc tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat 360 
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tttactaatt cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat 420 
gacagtatct ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga 480 
aataatcttg tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac 540 
atagcgtgta tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt 600 



attttatctc t 



<210> 67 

<211> 720 

<212> DNA 

<213> Blakeslea trispora 



611 



<400> 67 

atgtcaatac tcacttatct ggaatttcat ctctactata cactacctgt ccttgcggca 60 

ttgtgttggc tgctaaagcc gtttcactca cagcaagaca atctcaagta taaattttta 120 

atgttgatgg ccgcctctac cgcatcgatt tgggacaatt atatcgttta tcatcgcgct 180 

tggtggtact gtcctacttg tgttgtggct gtcattggct atgtacctct agaagaatac 240 

atgttcttta tcatcatgac tttaatgact gtcgcgttct caaactttgt tatgcgttgg 300 

cacttgcata ctttctttat tagacccaac acttcttgga agcaaacact attagtacgc 360 

cttgtgcctg tttcagcttt attggcaatc acttatcatg cttggcactt gacactgcca 420 

aataaacctt cattttatgg ttcatgcatc ctttggtatg cttgtcctgt gttggctatt 480 

ctttggctgg gtgctggcga atatatcttg cgtcgacctg tggctgtcct tttgtctatt 540 

gttatcccta gtgtatacct atgttgggct gatatcgtcg ctattagtgc tggcacatgg 600 

catatttctc ttagaacaag cactggcaaa atggtagtac ccgatttacc tgtagaagaa 660 

tgcctgtttt ttactttgat caacacagtc ttggtttttg ctacctgtgc tatagaccgc 720 
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<210> 68 
<211> 1089 
<212> DNA 

<213> Blakeslea trispora 
<400> 68 

ctgtacaaat catctgttca aaatcaaaac cctaaacaag ccatttccct tttccagcat 60 

gtcaaagagc tagcatgggc cttctgtctt cctgaccaaa tgctcaacaa tgaattgttt 120 

gatgatctta ctatcagctg ggatatttta cgtaaagcct caaagtcatt ctatactgca 180 

tctgccgttt ttccaagtta tgtacgtcaa gacttgggtg ttctctatgc tttctgcaga 240 

gctaccgatg acctgtgcga tgatgaatcc aaatctgttc aagaaagaag agaccaatta 300 

gatcttactc gacaatttgt tcgtgatctc tttagccaaa agaccagtgc gcctattgtg 360 

attgattggg aattgtatca aaaccaactt cctgcttctt gtatatcagc ctttagagcc 420 

tttactcgcc ttcgccatgt ccttgaagta gaccctgtag aagaactatt agatggttac 480 

aaatgggatc ttgagcgtcg tcctatcctt gatgaacaag acttggaggc atactctgct 540 

tgtgtggcca gtagtgtggg tgaaatgtgc acacgtgtga ttcttgctca agaccaaaag 600 

gaaaatgatg cttggataat tgaccgtgca cgtgagatgg ggctggtgct acaatacgtt 660 

aacattgctc gagacattgt gactgatagc gagactctgg gtcgatgtta tctgcctcaa 72 0 

caatggctta gaaaagaaga aacagaacaa atacagcaag gcaacgcccg tagcctaggt 780 

gatcaaagac tgttgggctt gtctctgaag cttgtaggaa aggcagacgc tatcatggtg 840 

agagctaaga agggcattga caagttgccg gcaaactgtc aaggcggtgt acgagctgct 900 

tgccaagtat atgctgcaat tggatctgta ctcaagcagc agaagacaac atatcctaca 960 

agagctcatc taaaaggaag cgaacgtgcc aagattgctc tgttgagtgt atacaacctc 1020 

tatcaatctg aagacaagcc tgtggctctc cgtcaagcta gaaagattaa gagttttttt 1080 
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1089 

gttgattag 



<210> 69 

<211> 611 

<212> DNA 

<213> Blakeslea trispora 



<400> 69 

agagataaaa taaaaagaga agaaaagaaa gtttgtacaa tttctttttg tttatataac 



attttaatct c 



<210> 70 

<211> 882 

<212> DNA 

<213> Haemiatococcus pluvialis 



60 



atacacgcta tgtcaacatt tagaataagg gggaaaaaat cttccatcat attcgaatgc 120 

acaagattat ttctttgttc gctctttttg gtcgggtcat cgagatttag agtgtaatca 180 

aagatactgt catctcgaga gcgttgcaca ggctgctgtt tgccaaattg gatgtttgcc 240 

gaattagtaa aatacgcaag catttcttac ctttccgctc ccttttccta attctcccaa 300 

agactaaatg aggaaagata aaggacaaag aaaatgtaaa gacaaagaaa ttgaaaacga 360 

tataaacttg cagcacgtaa gaccaaagca aattggtaac tattcttgtg tacaaacatg 420 

tataaaaaaa aacttttttt tgctcctgga ggacaaaatt tcaaactcct tgaagaagat 480 

tgcttgtata tctatcatat gcatatatca tatcgatgga aaaagaaagt caggcatgta 540 

tttataaaaa gaagaatgtg ccatgcttcc gaatttcttt tcactttctt ttccttatct 600 



611 



<400> 70 

atgctgtcga agctgcagtc aatcagcgtc aaggcccgcc gcgttgaact agcccgcgac 



atcacgcggc ccaaagtctg cctgcatgct cagcggtgct cgttagttcg gctgcgagtg 



60 
120 
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gcagcaccac agacagagga ggcgctggga accgtgcagg ctgccggcgc gggcgatgag 180 

cacagcgccg atgtagcact ccagcagctt gaccgggcta tcgcagagcg tcgtgcccgg 240 

cgcaaacggg agcagctgtc ataccaggct gccgccattg cagcatcaat tggcgtgtca 300 

ggcattgcca tcttcgccac ctacctgaga tttgccatgc acatgaccgt gggcggcgca 360 

gtgccatggg gtgaagtggc tggcactctc ctcttggtgg ttggtggcgc gctcggcatg 420 

gagatgtatg cccgctatgc acacaaagcc atctggcatg agtcgcctct gggctggctg 480 

ctgcacaaga gccaccacac acctcgcact ggaccctttg aagccaacga cttgtttgca 540 

atcatcaatg gactgcccgc catgctcctg tgtacctttg gcttctggct gcccaacgtc 600 

ctgggggcgg cctgctttgg agcggggctg ggcatcacgc tatacggcat ggcatatatg 660 

tttgtacacg atggcctggt gcacaggcgc tttcccaccg ggcccatcgc tggcctgccc 720 

tacatgaagc gcctgacagt ggcccaccag ctacaccaca gcggcaagta cggtggcgcg 780 

ccctggggta tgttcttggg tccacaggag ctgcagcaca ttccaggtgc ggcggaggag 840 

gtggagcgac tggtcctgga actggactgg tccaagcggt ag 882 

<210> 71 
<211> 528 
<212> DNA 

<213> Erwinia uredovora 
<400> 71 

atgttgtgga tttggaatgc cctgatcgtt ttcgttaccg tgattggcat ggaagtgatt 60 

gctgcactgg cacacaaata catcatgcac ggctggggtt ggggatggca tctttcacat 120 

catgaaccgc gtaaaggtgc gtttgaagtt aacgatcttt atgccgtggt ttttgctgca 180 

ttatcgatcc tgctgattta tctgggcagt acaggaatgt ggccgctcca gtggattggc 240 
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gcaggtatga cggcgtatgg attactctat tttatggtgc acgacgggct ggtgcatcaa 300 

cgttggccat tccgctatat tccacgcaag ggctacctca aacggttgta tatggcgcac 360 

cgtatgcatc acgccgtcag gggcaaagaa ggttgtgttt cttttggctt cctctatgcg 420 

ccgcccctgt caaaacttca ggcgacgctc cgggaaagac atggcgctag agcgggcgct 480 

gccagagatg cgcagggcgg ggaggatgag cccgcatccg ggaagtaa 528 



<210> 72 

<211> 762 

<212> DNA 

<213> Nostoc sp. PCC73102 



<400> 72 

atgatccagt tagaacaacc actcagtcat caagcaaaac tgactccagt actgagaagt 



60 



240 
300 



aaatctcagt ttaaggggct tttcattgct attgtcattg ttagcgcatg ggtcattagc 120 

ctgagtttat tactttccct tgacatctca aagctaaaat tttggatgtt attgcctgtt 180 
atactatggc aaacattttt atatacggga ttatttatta catctcatga tgccatgcat 
ggcgtagtat ttccccaaaa caccaagatt aatcatttga ttggaacatt gaccctatcc 

ctttatggtc ttttaccata tcaaaaacta ttgaaaaaac attggttaca ccaccacaat 36.0 

ccagcaagct caatagaccc ggattttcac aatggtaaac accaaagttt ctttgcttgg 420 

tattttcatt ttatgaaagg ttactggagt tgggggcaaa taattgcgtt gactattatt 480 

tataactttg ctaaatacat actccatatc ccaagtgata atctaactta cttttgggtg 540 

ctaccctcgc ttttaagttc attacaatta ttctattttg gtactttttt accccatagt 600 

gaaccaatag ggggttatgt tcagcctcat tgtgcccaaa caattagccg tcctatttgg 660 

tggtcattta tcacgtgcta tcattttggc taccacgagg aacatcacga atatcctcat 720 

atttcttggt ggcagttacc agaaatttac aaagcaaaat ga 762 



WO 2004/063359 



344/357 



PCT/EP2004/000099 



<210> 73 
<211> 617 
<212> DNA 

<213> Haematococcus pluvialis 
<400> 73 

tagggtgcgg aaccaggcac gctggtttca cacctcatgc ctgtgataag gtgtggctag 60 

agcgatgcgt gtgagacggg tatgtcacgg tcgactggtc tgatggccaa tggcatcggc 120 

catgtctggt catcacgggc tggttgcctg ggtgaaggtg atgcacatca tcatgtgcgg 180 

ttggaggggc tggcacagtg tgggctgaac tggagcagtt gtccaggctg gcgttgaatc 240 

agtgagggtt tgtgattggc ggttgtgaag caatgactcc gcccatattc tatttgtggg 3 00 

agctgagatg atggcatgct tgggatgtgc atggatcatg gtagtgcagc aaactatatt 360 

cacctagggc tgttggtagg atcaggtgag gccttgcaca ttgcatgatg tactcgtcat 420 

ggtgtgttgg tgagaggatg gatgtggatg gatgtgtatt ctcagacgta gaccttgact 480 

ggaggcttga tcgagagagt gggccgtatt ctttgagagg ggaggctcgt gccagaaatg 540 

gtgagtggat gactgtgacg ctgtacattg caggcaggtg agatgcactg tctcgattgt 600 

aaaatacatt cagatgc 617 



<210> 74 

<211> 1208 

<212> DNA 

<213> Haematococcus pluvialis 



<400> 74 

attgtgactg atagcgagac tctgggtcga tgttatctgc ctcaacaatg gcttagaaaa 



60 



gaagaaacag aacaaataca gcaaggcaac gcccgtagcc taggtgatca aagactgttg 120 
ggcttgtctc tgaagcttgt aggaaaggca gacgctatca tggtgagagc taagaagggc 180 
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attgacaagt tgccggcaaa ctgtcaaggc ggtgtacgag ctgcttgcca agtatatgct 240 

gcaattggat ctgtactcaa gcagcagaag acaacatatc ctacaagagc tcatctaaaa 300 

ggaagcgaac gtgccaagat tgctctgttg agtgtataca acctctatca atctgaagac 360 

aagcctgtgg ctctccgtca agctagaaag attaagagtt tttttgttga ttagtgaatt 420 

tttgttttat ttatgtctga tagttcaata aagagacaac acatacaata taaaatcatt 480 

gtctttaaat gttaatttag tagagtgtaa agcctgcatt ttttttgtac gcataaacaa 540 

tgaattcacc ccgcttctgg tttttaaata attatgtcaa actagggaaa attctttttt 600 
ttctcttcgt tctttttttg gcttgttgtg gagtcacagg cttgtcttca gattgataga 660 
ggttgtatac actcaacaga gcaatcttgg cacgttcgct tccttttaga tgagctcttg 72 0 
taggatatgt tgtcttctgc tgcttgagta cagatccaat tgcagcatat acttggcaag 780 
cagctcgtac accgccttga cagtttgccg gcaacttgtc aatgcccttc ttagctctca 840 
ccatgatagc gtctgccttt cctacaagct tcagagacaa gcccaacagt ctttgatcac 900 
ctaggctacg ggcgttgcct tgctgtattt gttctgtttc ttcttttcta agccattgtt 960 

gaggcagata acatcgaccc aacatcctcg agccatacta cagcataaaa ggatacgttt 1020 

tctttaacag aaatttaccc ttttgttatc agcacataca aaaaaaaaga aatttaagat 1080 

gagtaggact tccattctct caaaaatttt attcaatcca taaatgaatt atttttggac 1140 

aaaaaagaaa gattatgcct gattttctct attttttttt tttttacaac tccaccaata 1200 

ctttctag 1208 



<210> 75 

<211> 6316 

<212> DNA 

<213> Blakeslea trispora 



WO 2004/063359 



346/357 



PCT/EP2004/000099 



<220> 

<221> misc_feature 

<222> (2694) . . (2694) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (4263) . . (4263) 

<223> n is a, c, g, or t 

<400> 75 

aaggatgaag aatccaactc taataaaaat cttatggata tctttgatcg actcaaaaag 



60 



gctttcaatg ctattgctat taaaaaaaaa gagagagaga gaactatgag caaaaggact 120 

ctatgccaag atggcaaaaa ggcaccagaa acccttagtt tattattgca taatccagtc 180 

gagctagtac ttctgtagct caagcttaac cgaggatctt ggaatcaact cgtctcgtca 240 

ctcttgccga tgatcctaga aatggtatct atggatgtta tactaacatt gttatctttc 300 

aaggcctcga agatgttatt gttgcggtga taaataggct gctatgtact gaagttgctc 360 

tgtaaaatga atctagttca ctgcctactc agcaaatggt tgtttctaat gtctttaaag 420 

aaagaaaaaa agatacatat agactaccct tcctttcaag actgtaatcg agaatcggcc 480 

gatggtttat tacaattaga cgctgggaat aagcaaaagg attcatcttt gtaaataaga 540 

gactggtgca tatgaaagca aggatcgtat caaggaatag ttttgatcga gcatcaccag 600 

caaatgctgc taatgttggc ttcttctttg cttcctgaga ttgaatggga tgtgcctaga 660 

gcattgctat ttttaagtgt atactttaga tttgtgtctt tagatttgtg tcattttatt 720 

tagtcaagaa agatccccct ttctctatgt atgctaagaa gaaggagcaa gaagtgtatt 780 

tacaagttgg aatgagattg aaatattgta cataataata ataaaaagaa aggtagatca 840 

aaaaaaatgt tctgcctatt gtaagaaatc gggaccaaca ggtgcttgat aaccagaagt 900 
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agcttccaat tcaggtagag gctctaggga caaatacaca attatgacag gaattttctt 960 

gttgacttga acactacaag agaaacgggt cagcacaaaa tccgaaaaaa aaaagaaacg 1020 

gaccattcat gtcttaccta tctagctctt tgtcttcaat tgcatcccat tgctcaacca 1080 

cagatacgct tcccaattga - gtatattgat gaagtgttcc ctgcattttt cgcttgacta 1140 

attccactac agtcacagtc ttattaatgt tttgtccttt accagtcagg ataatatgat 1200 

ctttttgctt cttctatcaa aaaaataatt cttgttttga ataaaaaaaa caaatattta 1260 

aagaaactac tttgatgacg gtacctggaa taactcgaga cacacatcta catatgcgtt 1320 

gattttattg tggctaattc gaacctcatt ttctgctggt gggggctgtt gactttcagt 1380 

tgctgagacg tccttcttgc ttcttttata gtcttccact atgattttaa tcaagaaagt 1440 

aagtcagtga tgattgttac aagctatata tcttgaaaaa gaacagagag gtattattat 1500 

cagatgcaac atggttttct gtatcatttt catttcagtt tctctgttca aaaaaaaaaa 1560 

gaacactttc tctttccact cctcaaattt tttctgctaa actcctcgca aaacatgtat 1620 
ttgctttaaa ctacaagttg caattgtctg atttagcaat ttcaatatgc cttttgtgaa 1680 
tccacccaaa aataaacaag tgcttgagta tacttgggtt cagttcaaaa gaaagcaagc 1740 
tttttttttt ctttcttggg aaagaaaaaa aaatattgtt gagccatcct ttaccagcag 1800 
tatgcgagct acgacatagc tggtctaaca atgactgcaa gcaatagatc gagcttagtc 1860 
tttctattgc ttcyttgttt gatctatgtt cggccttacg ctgacctatc caatactcga 1920 
gataggcaac aagatttcga acagtaatga aataaatttc ggataacagt tgtggatgag 1980 
gaagagaaag cgacttgaac tcgagaaact ttgttgaaat gaaatccgac cttttacgtg 2040 
atcatcatgt attatcctct ttttcttttt tttcgtagtg aattacttac tgattgcgct 2100 
caagtcgcgt ctttataaag aagaaaaaaa aatattagaa ctttcaaaaa atataactga 2160 
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aaataaaagt gtggctcgga gagcaaatac cacatccttt gtcttcgctt tggtaacacg 2220 

gttaataagc cactataggt gaataatgat catttctgag aataaagcgc ggcttgaagc 2280 

ttatatccat atcaggattc atattaggca caactcacaa ttgaggttcc agaagtgcca 2340 

attttttttt cctgatagcc tgtccaatta agatcaaaaa ccactgagtt ttctctatat 2400 

attttttttt ttcataattc ttaactcttc ttcctctctc tctctctctc tctctttttg 2460 

gcttgcaaaa aaaatcttta gtaataccaa agaaagcaaa ccttttcctt ttcttatttc 2520 

cttgcttgtt ttttaatttt tgatttctct atgctttaaa tacccatttc tttctttctt 2580 

ctgctattac ctatcttttc attcctctcc cccctctctc tcttggtcta taaacatcat 2640 

gaagtcctct tttaaaagtt cgcttgacat ttatgctgtt tatatacagc atcntgtgtt 2700 

ttccaagtgg ttcattcttg cttttgttct ttcgattttc ctcaacactt atctactgaa 2760 

cgcttcgaag caacagccca aagtgataat caaaaaggtt attgagcggg tagaagtacc 2 820 

aagtagagaa caacctaaat cagtcataaa gccctcctcc aagaaacact cttctcatca 2 880 

tcagtctgat gtcattcgcc ctcttgatga agtattgggt ttgctcggaa cacccgaggc 2940 

cttgactgat gaagagatca tctctattgt tcaagctggt aaaatggccc cctatgctct 3000 

tgaaaaggtc ttgggcgatt tagagcgcgc tgtccatatc cgtcgtgctt tgatctcccg 3060 

tgactctcgt acgaaaactt tggaagacag tatgcttccc gtgaaaaact atcattatga 3120 

taaagtcatg ggtgcttgtt gtgaaaatgt cattggttat atgcctattc cagtaggtgt 3180 

cgcaggtaag aagttcaaca agtcgcgata tttgacaagt tgctcatcat tttcgaaaca 3240 
ggtcctttgg tgattgatgg tgattctatt catattccca tggcaactac ggaaggttgt 3300 
ttagttgctt ctactgccag aggttgtaaa gcaatcaatg ctggtggtgg tgccaacaca 3360 
attgttgttg ctgatggtat gactcgaggt ccttgtgtcg aatttcctac aatcactcgc 3420 
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gctgctgact gtaaacgatg gattgaacaa gagggtgaag ctatcgtgac cgaggcattc 3480 

aattcaactt ctcgttttgc tcgtgttcgt aaattgaaag ttgctcttgc cggtcgtcta 3540 

gtctacatcc gtttctctac cactacaggt gatgcaatgg gcatgaacat gatctccaag 3600 

ggttgtgaaa aggctttaag caagattgct gagagatatc ctgatatgca gatcatttct 3660 

ctttctggta actattgtac tgacaagaaa cctgctgcta tcaactggat tgaaggacgt 3720 

ggtaaatctg ttgttgctga sgctgtcatc cctggtacgg ttgtcgaaaa ggtattgaag 3780 

acctctgtta gtgctttggt tgagctgaac atctctaaaa acctggttgg ttctgctatg 3 840 

gctggctccg tcggtggctt taacgctcat gctgctaata ttctaactgc catttacctt 3900 

gctactggtc aagatcctgc tcaaaatgta sagagttcta actgtattac tttgatgaaa 3960 

gctgtcaatg gcgaaagaga ccttcatatc tcttgtacaa tgccctgtat tgaagtaggc 4020 

accattggtg gtggtactat tttgcctcct caacaagcca tgttggattt cattggtgtg 4080 

cgtggtcctc accctaccga acctggtgcc aatgcccgwc gccttgctcg tgttatctgt 4140 
gcctctgtga tggctggtga attgtcttta tgtgcagctt tggctgctgg tcatcttgta 4200 
aaggcacaca tggctcataa tcgtaatacc actgctgctg ccgctgttgt tcctgcccct 4260 
aanggcatag ttgatgtctc tacacctcct gctacacctg cagaaaagaa tgatcctatt 4320 
cctggaagtt gtatcaagtc atagaattaa tattatatat atatcatata caaaaaaaag 4380 
aaaaaaaaaa cactacatct atttatattt ctccatgtac acacacacac acacatataa 4440 
aaactcttta ttttccaata ttttgctttt ataaataatc ttatttcatt ctaaataaac 4500 
tgtttttttt tattaatcat caaaccctgc tgagagctgt gcaatatcat ctatgttttc 4560 
atggtttaac tctggtatcg gwcgagcctc ctctgtactt gaagtttgta ggcagttttt 4620 
atttaaggct gctggtcgat catgatcatc akcaaacctg acagcatgaa gttttgactg 4680 
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atgagcaatt tcactaaggg cagaatctga actctttcgc ttcctactat tgaccatatt 4740 

gtctttaggt ggaatgagtg aatagcgtct tgtcatatgt aacacagaat caacaatatc 4800 

ctggtgatga aactcggcca aacatagcgc ctttctcccc caacaattat aataatcaaa 4860 

atgagaatga catgtacggt tttcctcgat gacaatatcc aacgtcttgt cataatcctc 4920 

tgtgcgyata ccattcatct tttggaagaa cgcacggtag ctctcacaag ctgtcctcag 4980 

agagttccgt gccatgtttc ccaatgctcc tggcaagtcg aaatgaagtt gtcgaatctg 5040 

gcgatgtatg tctacaatgt cgcctgtttc tttcattaga tcaagcattc gtgtagccca 5100 

aatgatgtct atgttatgat tttctttcat tccagtaata actatagttt ctcggcaaat 5160 

cgaatgastg atggagtaaa ttcatcaaaa gtgcaagtaa tacatacagt gcttgaagaa 5220 

atcttgtgta gcacgcctat attatgtaat ataggatcga ttctcgaaac tcgacataac 5280 

caccaggctt tagcaagcgt tttatttcat tcatgacaag ctattgttaa ttcytgctta 5340 

ataaaacaaa atgaaaaaaa catacccccc tcmaaactta cttcccactc ttgattggaa 5400 

aaacaggtat agacgtgacg catatgtata taatcaaaac actcatcagg atagggtaaa 5460 

ccattgagca catcgcattg ggtgaagaaa gtattaggag gcttgatggc tgtaggatat 5520 

ataggtgcaa tatcaatacc gtaaaactca gcatttggga attctgtagc catctccaga 5580 

atccaagtac ctgtgccaca agcaacatca agcactttag gtaagggtat acattgttgt 5640 

tcttgttgtt gttgttgaca atcacttgag tctgagtttc gttttgattg ttttaatgac 5700 

aataattctt ttacaggtgc tgagaaatta ccgtcaaata gatacttgta aataaaatgc 5760 

taaaaataaa aacaatagaa aaaaaaattg acgctcattt cattactatg gaaataactg 5820 
caaaatctta ccacttgtac aagtctatct tgctcaatct catcgtttgg cagaatgtat 5880 
ttattgttgt agtattgata tcttctacca ttcatgatat aactgtcgct tctaatgctc 5940 
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tgaggtgaag tacttgtagg tgaaggtgga agtgacgcaa ttttgtcaag cttaacagga 6000 

tcctctcggc tacatgtttt ctgcatatca ggaaaatctt gtttatttga aacatcaaca 6060 

gtagatgtgg tgtgatcttt tttgaaaata tcgatgcctt cctttgaaag ccttttgaaa 6120 

ggctctttta acttttttga gtgagagcta cccatgatag cttatgaaga attaaaaaga 6180 

aaaaagcaaa aaaaattaaa aaaaaaaaaa gtagcaaaaa attctgtcgt aattatacaa 6240 

gccaatcaaa atcgaaattc atgcaaggca tagatgttca cgtggatttg atggttgatc 6300 

cttttttttt gcaaga 6316 

<210> 76 
<211> 1170 
<212> DNA 

<213> Thermus thezmophilus 
<400> 76 

atgaagcgcc tttccctgag ggaggcctgg ccctacctga aagacctcca gcaagatccc 60 

ctcgccgtcc tgctggcgtg gggccgggcc cacccccggc tcttccttcc cctgccccgc 120 

ttccccctgg ccctgatctt tgaccccgag ggggtggagg gggcgctcct cgccgagggg 180 

accaccaagg ccaccttcca gtaccgggcc ctctcccgcc tcacggggag gggcctcctc 240 

accgactggg gggaaagctg gaaggaggcg cgcaaggccc tcaaagaccc cttcctgccg 300 

aagaacgtcc gcggctaccg ggaggccatg gaggaggagg cccgggcctt cttcggggag 360 

tggcgggggg aggagcggga cctggaccac gagatgctcg ccctctccct gcgcctcctc 420 

gggcgggccc tcttcgggaa gcccctctcc ccaagcctcg cggagcacgc ccttaaggcc 480 

ctggaccgga tcatggccca gaccaggagc cccctggccc tcctggacct ggccgccgaa 540 

gcccgcttcc ggaaggaccg gggggccctc taccgcgagg cggaagccct catcgtccac 600 
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ccgcccctct cccaccttcc ccgagagcgc gccctgagcg aggccgtgac cctcctggtg 660 

gcgggccacg agacggtggc gagcgccctc acctggtcct ttctcctcct ctcccaccgc 720 

ccggactggc agaagcgggt ggccgagagc gaggaggcgg ccctcgccgc cttccaggag 780 

gccctgaggc tctacccccc cgcctggatc ctcacccgga ggctggaaag gcccctcctc 840 

ctgggagagg accggctccc cccgggcacc accctggtcc tctcccccta cgtgacccag 900 

aggctccact tccccgatgg ggaggccttc cggcccgagc gcttcctgga ggaaaggggg 960 

accccttcgg ggcgctactt cccctttggc ctggggcaga ggctctgcct ggggcgggac 1020 

ttcgccctcc tcgagggccc catcgtcctc agggccttct tccgccgctt ccgcctagac 1080 

cccctcccct tcccccgggt cctcgcccag gtcaccctga ggcccgaagg cgggcttccc 1140 

gcgcggccta gggaggaggt gcgggcgtga 1170 

<210> 77 
<211> 2981 
<212> DNA 

<213> Blakeslea trispora 
<400> 77 

tctagaattc attccattcg aaaggatcaa cataaccaat ttaatgacta ctagctaatg 60 

gatacaaata tacgcacaaa aaaagaaaga attctatgat caaagagaac acagacacag 120 

agtgatacat ttaaatggtt aagttcttat gatgttaaaa tggtaacttt attattgaat 180 

taaatgcgaa tatcgttgct gctttgtact tggaaaacgt taggtaaaag ttggttaatg 240 

aaagaagcag gagttgtagt atcatctctt gggaagaaat agaaaaagag gaaagtaaca 300 

aagtaacaag caagacaata atagatccaa tggctttcgg tcttacgagt ttgttcagga 3 60 

gcatacttct tttggctatc ttgtaacttt cttggtaagg gattctggcc aaagctttta 420 

cagacttggt cggaagtaag cttacttcca gcaagaacga taggaacacc agtacctgga 480 
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tgtgtactac aaagaaaaga gaaatgagta cgtgcgttat taaaaaaaag aaaaaaagag 540 

ggcaaaagta ttacctagct ccgacaaaga aaagattatc ataacggttt gtggaatcct 600 

tggtactagg tctgaaccag agaacttgga acacatcatg agaaagacca agaatagaac 660 

ctctccaaag gttaaacttg ctttgccaaa cactaggatc attcacttct tcatgttcaa 720 

tcaaattagc aaagttgttt actcccaaac gacgttcgat aacttccaga accatcttgc 780 

gtgcacggtt taccaactca ggataatttt cttcagcact gtttcctgtc ttactcttca 840 

tatggccaat tggaaccaac acaataatgg agtccttgtt gggaggtgcg gcagattcat 900 

caattcgaga tggaacgttg acatagaatg aagcttcaga gggcaaaccg aagtcgttga 960 

aaatctcatc aaaactttcc ttgtaggctt cagccaagaa gatattgtgt acgtctaatt 1020 

gaggcacctt tgttgacatg gaccaataaa acgaaataga tgatgaagtg agtttctttg 1080 

aggctaatgt cttctttgtc caattgcaag gaggtaacag atggtgataa gcataaacaa 1140 

gatccgcatt acatacgact gcatcggctt caatgacttc tccgctttcc aaagtgacac 1200 

cggttacacg cttgtcttta tcgacagtgt taattttagc aacaggcgat tgatatctga 1260 

attcagcacc gtactttttg gaggcgatag actcaagctt ctgaacaacc atgttgaaac 1320 

caccacgagg ataccagata ccttcagcaa actcggtgta ttgtaacaaa ctgtaaactg 13 80 

ctggagcatc ataaggcgac atactatatt ccaaaaatag aaaatagaac aatgaatatc 1440 

aaaattcctt tcacttgccc tttttcacat ttctcttttc ccacccccga ccggtctcac 1500 

tcattttttt ttcatcccac accacgcgtt gtatgtgtac ttaccccata tacattgttt 1560 

gaaaagtaaa agccatacgc attttcttgg tttggaaata tttactggct cggtcataga 1620 

tcttaccaaa caagtgcaag cgaaagattt caggcacata ctgaagacga atcaaatccc 1680 

aaatggtttc aaagttgcgc ttgatagcaa taaatgtacc ttgttcataa tggacatgtg 1740 
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tttccttcat gaaatccaag aatctaccaa atccaagggg accctcaata cggtccaatt 1800 

cgcccttcat cttggttaaa tcggaagaga gttgtacggc atcaccgtcg tcaaaatgaa 1860 

ccttatagtt attgtcacag cgaagcaaat ccaaatgatc accaatacgt tcatccaaat 1920 

cagcaaatgc atcttcaaaa agcttaggca tcaaatagag tgagggaccc tgatcaaagc 1980 

gatgaccatc gtgatgaatg aatgaacaac ggccaccgga aaagtcgttc ttttcaacaa 2040 

cagtaactcg aaaaccttca cgagcaagac gagcagcagt agcagttccg ccaataccgg 2100 

caccaatgac aacaatatgc ttcttttgat cagacatgag attaaaatag ataaggaaaa 2160 

gaaagtgaaa agaaattcgg aagcatggca cattcttctt tttataaata catgcctgac 2220 

tttctttttc catcgatatg atatatgcat atgatagata tacaagcaat cttcttcaag 2280 

gagtttgaaa ttttgtcctc caggagcaaa aaaaagtttt tttttataca tgtttgtaca 2340 

caagaatagt taccaatttg ctttggtctt acgtgctgca agtttatatc gttttcaatt 2400 

tctttgtctt tacattttct ttgtccttta tctttcctca tttagtcttt gggagaatta 2460 

ggaaaaggga gcggaaaggt aagaaatgct tgcgtatttt actaattcgg caaacatcca 2520 

atttggcaaa cagcagcctg tgcaacgctc tcgagatgac agtatctttg attacactct 2580 

aaatctcgat gacccgacca aaaagagcga acaaagaaat aatcttgtgc attcgaatat 2640 

gatggaagat tttttccccc ttattctaaa tgttgacata gcgfcgtatgt tatataaaca 2700 

aaaagaaatt gtacaaactt tcttttcttc tctttttatt ttatctctat gtcaatactc 2760 

acttatctgg aatttcatct ctactataca ctacctgtcc ttgcggcatt gtgttggctg 2820 

ctaaagccgt ttcactcaca gcaagacaat ctcaagtata aatttttaat gttgatggcc 2880 

gcctctaccg catcgatttg ggacaattat atcgtttatc atcgcgcttg gtggtactgt 2940 

cctacttgtg ttgtggctgt cattggctat gtacctctag a 2981 
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<210> 78 
<211> 1749 
<212> DNA 

<213> Blakeslea trispora 
<400> 78 

atgtctgatc aaaagaagca tattgttgtc attggtgccg gtattggcgg aactgctact 60 

gctgctcgtc ttgctcgtga aggttttcga gttactgttg ttgaaaagaa cgacttttcc 120 

ggtggccgtt gttcattcat tcatcacgat ggtcatcgct ttgatcaggg tccctcactc 180 

tatttgatgc ctaagctttt tgaagatgca tttgctgatt tggatgaacg tattggtgat 240 

catttggatt tgcttcgctg tgacaataac tataaggttc attttgacga cggtgatgcc 300 

gtacaactct cttccgattt aaccaagatg aagggcgaat tggaccgtat tgagggtccc 360 

cttggatttg gtagattctfc ggatttcatg aaggaaacac atgtccatta tgaacaaggt 42 0 

acatttattg ctatcaagcg caactttgaa accatttggg atttgattcg tcttcagtat 480 

gtgcctgaaa tctttcgctt gcacttgttt ggtaagatct atgaccgagc cagtaaatat 540 

ttccaaacca agaaaatgcg tatggctttt acttttcaaa caatgtatat gggtatgtcg 600 

ccttatgatg ctccagcagt ttacagtttg ttacaataca ccgagtttgc tgaaggtatc 660 

tggtatcctc gtggtggttt caacatggtt gttcagaagc ttgagtctat cgcctccaaa 720 

aagtacggtg ctgaattcag atatcaatcg cctgttgcta aaattaacac tgtcgataaa 780 

gacaagcgtg taaccggtgt cactttggaa agcggagaag tcattgaagc cgatgcagtc 840 

gtatgtaatg cggatcttgt ttatgcttat caccatctgt tacctccttg caattggaca 900 

aagaagacat tagcctcaaa gaaactcact tcatcatcta tttcgtttta ttggtccatg 960 

r 

tcaacaaagg tgcctcaatt agacgtacac aatatcttct tggctgaagc ctacaaggaa 1020 
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agttttgatg agattttcaa cgacttcggt ttgccctctg aagcttcatt ctatgtcaac 1080 

gttccatctc gaattgatga atctgccgca cctcccaaca aggactccat tattgtgttg 1140 

gttccaattg gccatatgaa gagtaagaca ggaaacagtg ctgaagaaaa ttatcctgag 1200 

ttggtaaacc gtgcacgcaa gatggttctg gaagttatcg aacgtcgttt gggagtaaac 1260 

aactttgcta atttgattga acatgaagaa gtgaatgatc ctagtgtttg gcaaagcaag 1320 

tttaaccttt ggagaggttc tattcttggt ctttctcatg atgtgttcca agttctctgg 13 80 

ttcagaccta gtaccaagga ttccacaaac cgttatgata atcttttctt tgtcggagct 1440 

agtacacatc caggtactgg tgttcctatc gttcttgctg gaagtaagct tacttccgac 1500 

caagtctgta aaagctttgg ccagaatccc ttaccaagaa agttacaaga tagccaaaag 1560 

aagtatgctc ctgaacaaac tcgtaagacc gaaagccatt ggatctatta ttgtcttgct 1620 

tgttactttg ttactttcct ctttttctat ttcttcccaa gagatgatac tacaactcct 1680 

gcttctttca ttaaccaact tttacctaac gttttccaag tacaaagcag caacgatatt 1740 

cgcatttaa 1749 



<210> 79 

<211> 25 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 79 

ccgatggcga cgacggaagg ttgtt 25 



<210> 80 
<211> 25 
<212> DNA 
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<213> Artificial 



<220> 

<223> Primer 
<400> 80 

catgttcatg cccattgcat cacct 



